Transformem um sítio em livro electrónico


icône-web-2-chm

Chega às vezes de cair sobre um sítio tanto interessante que quereria-se ser certo de poder consultá-lo à vontade. Contudo o web tem um carácter tão efémero que ainda que salvaguarda-se a relação, está-se nunca certo que o sítio esteja ainda disponível ao momento oportuno.

Que de mais prático enquanto que de recuperar o sítio inteiro sob forma de livro electrónico consultável hors ligne? É que permitimos o formato CHM de Microsoft. Este formato permite agrupar várias páginas HTML num ficheiro único que se executa num miniexplorador. De comum utilizado para os manuais de ajuda, tem a vantagem de ser legível em nativo sobre windows e de ocupar pouco espaço disco.

Neste tutoriel, o método não será explicado - - à não através de um exemplo concreto: o sítio Craque Entrevista, que analisa 64 perguntas prende habitualmente postas aquando das entrevistas de contratação.

1a etapa: aspirar o sítio

Para aspirar o sítio Craque Entrevista, vamos utilizar o "software" livre WinHTTrack. Por precaução, asseguram de regular as opções como segue (em opções, onglete Build):

opções do

Uma vez o sítio recuperado, pode suprimir todos os ficheiros /hts-cache/new. *
Não deixam de ser úteis. Velam também por que existe efectivamente um ficheiro /web/index.html

No nosso caso, vamos suprimir o ficheiro /web/index.html e rebatizar o ficheiro 64Answers.html em index.html.

2.a etapa: limpeza do código javascript

Para evitar ter erros javascript aquando da consulta dos ficheiros HTML, vamos utilizar o certificado Python stripscripts.py téléchargeable sobre o sítio de SebSauvage.

Para poder utilizar-o, terá necessidade de instalar o language Python (utilizam a relação Python 2.X.X Windows instalar).

Copiam seguidamente o certificado stripscripts.py em C:\Python25 seguidamente abrem uma consola (atalho win-R e dactilografam cmd). Vão no directório de Python graças à encomenda Cd Python25 seguidamente lançam o certificado: python stripscripts.py <chemin do sítio armazenado sobre o disco dur> como isto:

O certificado Python em acção

No nosso caso, vai-se também suprimir os ficheiros .js situados no directório \ web \ js do sítio aspirado.

3.a etapa: instalação de Microsoft HTML Help Sessão de trabalho (gratuito)

Este programa é necessário à compilação dos ficheiros HTML em formato CHM. Poderá do fazer o download sobre a página Microsoft HTML Help Downloads.

4.a etapa: criação do livro electrónico

Para criar o ficheiro CHM, vai-se utilizar o freeware Web2HtmlHelp.

Ecrã 1:
Clicam Next

Ecrã 2:
Web Documento Índice Fila: seleccionam o ficheiro /web/index.html
HTMLHelp Titlebar Text: entram no título do ficheiro CHM que será afixado na janela.
Clicam em Next

Ecrã 3:
Assinalam Save user changes to size and position
Clicam em Next

Ecrã 4:
Deixam assinalados apenas: Show Toolbar, Back, Print, Forward, Home, Options, Font
Centro filename: seleccionam index.html
Clicam em Next

Ecrã 5:
Assinalam Show search pane
Assinalam Use advanced search
Assinalam Start with search pane closed.
Atiram os outros
Clicam em Next

Ecrã 6:
HTML Help Saída Filename: é imperativo indicar um nome de ficheiro que não se encontra no directório no qual recuperou o sítio.
Clicam em Create! e sobre o botão Yes.
Utilização de web2CHM para converter um sítio em ebook ao formato CHM

Uma janela MS-dos vai afixar-se durante a compilação.
Após a compilação, um ficheiro texto abre-se que mostra-vos os ficheiros que foram compilados (e eventuais os erros).
Fecham este ficheiro.
O ficheiro chm compilado afixa-se então.

Ouf é terminada!
O sítio recuperado ao formato CHM

Pode clicar no botão Show (em parte superior à esquerda) para afixar/mascarar o motor de pesquisa.

Notam que este método não continua capaz de recuperar todos os sítios, em especial os sítios cujas páginas são geradas dinamicamente. Há também um limite de 32.000 ficheiros máximos.

Notam que em certos casos deverá corrigir manualmente algumas páginas antes de compilar-o com web2hh.
Aquilo é às vezes necessário com certas extremidades de Javascript ou certas imagens.

Não esquecem de respeitar os direitos de autores dos sítios que recupera.

[Este artigo é baseado no artigo recuperar um sítio web em .chm de SebSauvage sobre como aquilo anda]

Tags: , , , , , , , , ,

Se gostar deeste artigo, der mais visibilidade votando por ele sobre Scoopeo:


Artigos similares (em teoria):
Making o DE work: o novo livro de David Allen
Getting Things Tratamento cedo disponível em francês!
Há um ano sobre relâmpago! - Agosto de 2007
Livros para alterar de vida
1000 livros audio gratuitos livre téléchargement


Acrescentam um comentário

Nome:

Enviar por correio electrónico:

Website:

Como: