Citat:
Srđan Pavlović: ma nije nista cudno da za one kuke i motike treba 170mb - samo mi smesno :D
Zaboravio sam još da se osvrnem na to što vindouz za zapis unikoda podrazumevano koristi UTF-16, gde svaki znak zauzima najmanje dva bajta. U ta dva bajta stane kako bilo koji evropski znak (slovo) tako i bilo koji kineski znak (ideogram). Međutim, kako jedan ideogram nosi sadrži više informacije od jednog slova, kineski tekst je u proseku oko 60% kraći od engleskog po broju znakova, pa i zauzima toliko manje prostora od engleskog.
Čak i kad se koristi UTF-8, kao na linuksu, gde latinica-1 traži jedan bajt po znaku prema tri bajta za CJK ideograme, izvorne lokalizacione datoteke za kineski zauzmu tek 10% više prostora nego za norveški. Kada se kompiluju i zapakuju, ova razlika se svede na 2%.
„Kuke i motike“ dakle ovde ne mogu biti razlog nesrazmeri veličina paketa.