Kaydol

Flood göndermek, insanların floodlarını okumak ve diğer insanlarla bağlantı kurmak için sosyal Floodlar ve Flood Yanıtları Motorumuza kaydolun.

Oturum aç

Flood göndermek, insanların floodlarını okumak ve diğer insanlarla bağlantı kurmak için sosyal Floodlar ve Flood Yanıtları Motorumuza giriş yapın.

Şifremi hatırlamıyorum

Şifreni mi unuttun? Lütfen e-mail adresinizi giriniz. Bir bağlantı alacaksınız ve e-posta yoluyla yeni bir şifre oluşturacaksınız.

3 ve kadim dostu 1 olan sj'yi rakamla giriniz. ( 31 )

Üzgünüz, Flood yazma yetkiniz yok, Flood girmek için giriş yapmalısınız.

Lütfen bu Floodun neden bildirilmesi gerektiğini düşündüğünüzü kısaca açıklayın.

Lütfen bu cevabın neden bildirilmesi gerektiğini kısaca açıklayın.

Please briefly explain why you feel this user should be reported.

Creating ZIM files for Kiwix by myself?

I’ve downloaded all of the Kiwix ZIM files I think I like, but there are some other websites I wouldn’t mind downloading

I tried https://youzim.it/ which has a 1000 page limit

I don’t really want to open a GitHub request for each site I personally want. Is there any way to just do it from home? I don’t even mind if it takes a week or two to crawl, and of course I have plenty of bandwidth and storage

Benzer Yazılar

Yorum eklemek için giriş yapmalısınız.

2 Yorumları

  1. r/kiwix would be the place to ask, but at the end of the day it all comes down to heading out to [openzim.org](https://openzim.org) (or the corresponding [github repo](https://github.com/openzim)) and figuring it out. You can either grab zimit and run it locally, or access all the libraries that will help you build your own scraper ([Nautilus](https://github.com/openzim/nautilus) will assemble documents and videos into a single file library, [MWoffliner](https://github.com/openzim/mwoffliner) will do for wikis, [youtube](https://github.com/openzim/youtube) will do YouTube, etc.).

    The zim format’s big advantage is that 1) the compression is very good and 2) it packages the whole target website into a single, neat file (as opposite to a folder with every single element), which means as you said that it takes a bit of processing. There’s no out-of-the-box, readily available way around that if you want something neat. Needs a bit of coding skills (python will suffice).

  2. What kind of websites? Not everything is easy to export into HTML. After you found a way to produce the HTML, see https://wiki.openzim.org/wiki/Build_your_ZIM_file

    Honestly it might be easier to use wpull and warc-proxy.