Com toda essa mudança, resolvi estudar a possibilidade de converter o MediaWiki para Wordpress.
Sempre achei que não fazia sentido ter um mediawiki instalado se a Wikipedia quer ser o conteudo de tudo… Porque vou ter conteudo fora… usando o mesmo software deles?
Agora, se consigo colocar no Wordpress e realmente fazer o site ficar da minha maneira, pode ser uma boa.
Achei um script perl para fazer a conversão:
https://github.com/m1geo/MediaWiki-to-WordPress
que é derivado do
http://www.analogrithems.com/rant/portfolio/mediawiki2wordpress/
A questão é que descobri que o arquivo gerado pela manutenção do mediawiki dumpBackup é um xml compativel com esse script
-
acentos não foram reconhecidos
-
O que sai do dumpbackup é: dumpContent.xml: text/html; charset=utf-8; o que sai do conversor perl é wordpress.xml: text/xml; charset=us-ascii; e o que sai do split é wordpress_Part_001_of_2.xml: text/xml; charset=us-ascii
- Utilizei o comando file -I nomedoarquivo para descobrir isso
- Mas encontri tambem esse servico online https://nlp.fi.muni.cz/projects/chared/
- O erro deve estar no arquivo que sai do conversor… vamos la tentar novamente mudando o charset
-
O que sai do dumpbackup é: dumpContent.xml: text/html; charset=utf-8; o que sai do conversor perl é wordpress.xml: text/xml; charset=us-ascii; e o que sai do split é wordpress_Part_001_of_2.xml: text/xml; charset=us-ascii
- links importados foram hardcoded dentro do script, tenho que editar. Acho que um simples search & replace funciona, tanto no script, quanto no xml ou mesmo no proprio wordpress