Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!
Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.
Mam problem z przetworzeniem pliku html.
Niby file pokazuje format HTML cat również poprawnie go pokazuje natomiast polecenie cat plik.html |less już pokazuje mi tak jakby był binarką
Plik był generowany przez program księgowy
próbowałem w przeglądarce zapisać go jako tekstowy i lipa.
Offline
Ja osobiście nie rozumiem w czym problem. Jakbyś pokazał wyniki tego cat i cat ...|less jakiś kawałek, to może dochodzenie by poszło sprawniej.... Może coś w stylu [tt]cat plik.html > plik[/tt] pomoże?
Offline
cat plik_html |less wygląda tak
[url]http://ubuntuone.com/1ihIUvu4W6jDseLKYQBEeO[/url]
Bez less jak zcatuje pokazuje mi normalnie znaczniki z trescią.
Może coś w stylu cat plik.html > plik pomoże?[/quote]
Próbowałem nic nie daje
Offline
Dlaczego [tt]cat plik.html |less[/tt] zamiast [tt]less plik.html[/tt]?
Offline
A... Wszystko jasne... Musisz usunąć białe znaki coś w stylu:
cat plik |sed 's/\s//g'
Jak się nie uda podeślij mi jakoś ten plik...
P.S.
Oczywiście głowy nie daje, że to jest to co opisałem, ale tak mi się wydaje ;p
Offline
Pewnie kodowanie, np base64, rot13 czy coś podobnego.
Przeglądarki potrafią to interpretować, w przeciwieństwie do ludzi.
W każdym razie, jak przeglądarka to otwiera, to znaczy, że da się to odczytać.
Offline
@Minio
Jakoś tak z przyzwyczajenia ale dzięki twój sposób to nawet mi wypluwa że plik może być binarny.
P@blo
Twój sposób owszem usunął białe znaki ale kodowanie pozostało. Pliku natomiast nie prześlę bo są w nim dane firmy, musisz zrozumieć.
To może inaczej jak sprawdzić w czym to jest kodowane?
Offline
Skoro cat go catuje, a less go źle lessuje to problem jest w less. I faktycznie, bo na przykład "less" puszczone na "git log" z kolorkami pokazuje znaki kolorów jako jakieś krzaczki czy coś.
Pewnie interesuje się opcja "-r".
"less -r $PLIK" lub to brzydsze "cat $PLIK | less -r"
Offline
@NIC
nie pomogło
Offline
Spoko rozumiem... Myślałem, że to problem typu - napisałem plik pod win i chce go oglądnąć pod lin. Bo win nawet ma znaczek na 'enter' i z tym i się skojarzyło :)
Offline
A tak mi pluje jak zapuszcze na ten plik kawalek kodu pythona
#!/usr/bin/python # -*- coding: utf-8 -*- lista_linijek = [] for linijka in open('/home/tk/Praca/nowy.txt', 'r'): print(linijka) lista_linijek.append(linijka) print(lista_linijek)
[url]http://ubuntuone.com/3ZieC6cRLGHXLhNr9PvWSM[/url]
Offline
Chyba pomyliłeś link, bo to nie do pythona, ale do HTMLa. I wygląda na UTF-16.
Spróbuj: export LESSCHARSET="utf-16"; less $PLIK
Can less display non-English language characters?
Less has two ways to display non-English characters. If your system uses a non-ASCII single-byte character set, you should set up your system with the correct "locale" settings. If your system does not support setlocale, you can set the LESSCHARSET or LESSCHARDEF environment variable to tell less what language you are using. See the section "NATIONAL CHARACTER SETS" in the man page for details.
If your system supports the UTF-8 encoding of Unicode for non-ASCII text, as many modern systems do, you should either set your locale to something that includes the string "UTF-8" or "UTF8" (either uppercase or lowercase is ok), or set LESSCHARSET to "utf-8".[/quote]
źródło: http://www.greenwoodsoftware.com/less/faq.htmlOstatnio edytowany przez NIC (2012-02-13 21:55:18)
Stronka-dom: [url]http://titek.victorygames.pl[/url]
Jabber: nic@jabster.pl
Hobby: kompilowanie Linuksa, Bluetooth
Dystrybucja: żadna, bliski krewny LFS, składak
Offline
Po eksporcie
less plik.html
invalid charset name
Offline
Tak. less nie obsługuje UTF-16. less obsługuje tylko i wyłącznie ASCII i UTF8.
Więc potrzebujesz konwertować, np.
iconv -f utf-16 < $PLIK | less
Offline
To samo co wyżej u mnie w poście
Offline
A tak. Wybacz. Dałem tam Ci exporta. To cofnie tamten krok i już less zacznie działać w tej sesji terminala :)
unset LESSCHARSET
Offline
O zadziałało
Super dzięki, już powoli czacha mi się przegrzewała.
Offline
Time (s) | Query |
---|---|
0.00009 | SET CHARSET latin2 |
0.00003 | SET NAMES latin2 |
0.00098 | SELECT u.*, g.*, o.logged FROM punbb_users AS u INNER JOIN punbb_groups AS g ON u.group_id=g.g_id LEFT JOIN punbb_online AS o ON o.ident='3.21.248.105' WHERE u.id=1 |
0.00060 | REPLACE INTO punbb_online (user_id, ident, logged) VALUES(1, '3.21.248.105', 1732961965) |
0.00055 | SELECT * FROM punbb_online WHERE logged<1732961665 |
0.00070 | SELECT topic_id FROM punbb_posts WHERE id=194541 |
0.00094 | SELECT id FROM punbb_posts WHERE topic_id=20660 ORDER BY posted |
0.00049 | SELECT t.subject, t.closed, t.num_replies, t.sticky, f.id AS forum_id, f.forum_name, f.moderators, fp.post_replies, 0 FROM punbb_topics AS t INNER JOIN punbb_forums AS f ON f.id=t.forum_id LEFT JOIN punbb_forum_perms AS fp ON (fp.forum_id=f.id AND fp.group_id=3) WHERE (fp.read_forum IS NULL OR fp.read_forum=1) AND t.id=20660 AND t.moved_to IS NULL |
0.00004 | SELECT search_for, replace_with FROM punbb_censoring |
0.00126 | SELECT u.email, u.title, u.url, u.location, u.use_avatar, u.signature, u.email_setting, u.num_posts, u.registered, u.admin_note, p.id, p.poster AS username, p.poster_id, p.poster_ip, p.poster_email, p.message, p.hide_smilies, p.posted, p.edited, p.edited_by, g.g_id, g.g_user_title, o.user_id AS is_online FROM punbb_posts AS p INNER JOIN punbb_users AS u ON u.id=p.poster_id INNER JOIN punbb_groups AS g ON g.g_id=u.group_id LEFT JOIN punbb_online AS o ON (o.user_id=u.id AND o.user_id!=1 AND o.idle=0) WHERE p.topic_id=20660 ORDER BY p.id LIMIT 0,25 |
0.00080 | UPDATE punbb_topics SET num_views=num_views+1 WHERE id=20660 |
Total query time: 0.00648 s |