Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!
Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.
Mam ci ja plik w formacie:
Lorem ipsum * dolor * sit * amet
Muszę go przerobić na:
Lorem ipsum * dolor * sit * amet
ewentualnie (choć wolę powyższy):
Lorem ipsum * dolor * sit * amet
Wszystko jedno czy sed, czy awk, czy tr, czy perl (jeśli już nie da się po ludzku ;)) czy inny pies, byle tekstowo. Dumam nad tym i dumam... Pomożecie?
Offline
Takie cuś będzie dobre?
sed 's/\(Lorem ipsum\)/\1\n/'
$ cat test.txt Lorem ipsum * dolor * sit * amet $ sed -i 's/\(Lorem ipsum\)/\1\n/' test.txt $ cat test.txt Lorem ipsum * dolor * sit * amet [lessmian@polikarp:~/scripts]$
Offline
Tak, tylko to [i]Lorem ipsum[/i] to był przykład. Chodzi o uniwersalną metodę oddzielenie jakiegoś „zwykłego” tekstu, od tego zaczynającego się od „*”.
Offline
[quote=azhag]Chodzi o uniwersalną metodę oddzielenie jakiegoś „zwykłego” tekstu, od tego zaczynającego się od „*”[/quote]
Tego akurat nie napisałeś w pierwszym poście ;)
Można to zrobić tak:
sed '0,/\(^\*\)/s//\n\1/'
Ale to znowu zadziała tylko dla pierwszego bloku tekstu - jeśli w pliku będzie więcej takich, trzeba poszukać czegoś innego.
Offline
W awku się da - możesz zapamiętać czy poprzednia linia zaczynała się gwiazdką i jeśli nie, a bieżąca zaczyna się gwiazdką to dodajesz przed bieżącą znak nowej linii. Tak samo dla przypadku odwrotnego...
cat dupa.txt | awk 'BEGIN {a=0}; {b=0; if (substr($0,0,1) == "*") b=1;if (a !=b) print "";a=b;print $0 }'
Może być?
Pewnie można prościej ale właśnie wypiłem jedenaste piwo :)
Offline
[quote=lessmian][quote=azhag]Chodzi o uniwersalną metodę oddzielenie jakiegoś „zwykłego” tekstu, od tego zaczynającego się od „*”[/quote]
Tego akurat nie napisałeś w pierwszym poście ;)[/quote]
No... przynajmniej nie wprost, jedynie wspomniałem o „formacie”. Moja wina :)
[quote=lessmian]Można to zrobić tak:
sed '0,/\(^\*\)/s//\n\1/'
Ale to znowu zadziała tylko dla pierwszego bloku tekstu - jeśli w pliku będzie więcej takich, trzeba poszukać czegoś innego.[/quote]
O, dzięki wielkie. :)
Na razie biorę to, jak ktoś wymyśli co zrobić, jeśli owe bloki występować będą częściej.
W międzyczasie wydumałem (jeżu, przecież to takie banalne!) jak zrobić, aby zawsze stawiał znak nowej linii, również między liniami zaczynające się od gwiazdki):
sed "s/^*/\n*/g" plik
Dopisek:
[quote=ethanak]W awku się da - możesz zapamiętać czy poprzednia linia zaczynała się gwiazdką i jeśli nie, a bieżąca zaczyna się gwiazdką to dodajesz przed bieżącą znak nowej linii. Tak samo dla przypadku odwrotnego...
cat dupa.txt | awk 'BEGIN {a=0}; {b=0; if (substr($0,0,1) == "*") b=1;if (a !=b) print "";a=b;print $0 }'
Może być?[/quote]
Dzięki. :)
[quote=ethanak]Pewnie można prościej ale właśnie wypiłem jedenaste piwo :)[/quote]
Pozdrów ode mnie dwunaste. ;)
Ostatnio edytowany przez azhag (2010-07-28 21:46:09)
Offline
Ha, dłubałem i wydłubałem :)
sed '/^[^*]/{n;s/\(^*\)/\n\1/}'
Jednak ten sed nie jest taki głupi ;>
Ostatnio edytowany przez lessmian (2010-07-28 22:42:09)
Offline
[quote=lessmian]Ha, dłubałem i wydłubałem :)
sed '/^[^*]/{n;s/\(^*\)/\n\1/}'
Jednak ten sed nie jest taki głupi ;>[/quote]
nie do końca działa:
azhag@debian:/tmp$ cat plik3 Lorem ipsum * dolor * sit * amet azhag@debian:/tmp$ cat plik2 Lorem ipsum dolor sit * dolor * sit * amet azhag@debian:/tmp$ sed '/^[^\*]/{n;s/\(^\*\)/\n\1/}' plik3 Lorem ipsum * dolor * sit * amet azhag@debian:/tmp$ sed '/^[^\*]/{n;s/\(^\*\)/\n\1/}' plik2 Lorem ipsum dolor sit * dolor * sit * amet
Offline
Czary. Na Twoim pliku nie działa, na moim napisanym z palca śmiga aż miło.
$ cat test3.txt foo Bar baz * dupa * cycki $ sed '/^[^\*]/{n;s/\(\*\)/\n\1/}' test3.txt foo Bar baz * dupa * cycki
Chwilowo się poddaje, hgw, idę spać ;)
Offline
U mnie na Twoim też śmiga, nawet po dopisaniu tego czy tamtego... Czary.
Debianoc. :)
Offline
Time (s) | Query |
---|---|
0.00012 | SET CHARSET latin2 |
0.00004 | SET NAMES latin2 |
0.00101 | SELECT u.*, g.*, o.logged FROM punbb_users AS u INNER JOIN punbb_groups AS g ON u.group_id=g.g_id LEFT JOIN punbb_online AS o ON o.ident='3.146.152.119' WHERE u.id=1 |
0.00064 | REPLACE INTO punbb_online (user_id, ident, logged) VALUES(1, '3.146.152.119', 1732341191) |
0.00041 | SELECT * FROM punbb_online WHERE logged<1732340891 |
0.00070 | SELECT topic_id FROM punbb_posts WHERE id=152861 |
0.00004 | SELECT id FROM punbb_posts WHERE topic_id=17305 ORDER BY posted |
0.00087 | SELECT t.subject, t.closed, t.num_replies, t.sticky, f.id AS forum_id, f.forum_name, f.moderators, fp.post_replies, 0 FROM punbb_topics AS t INNER JOIN punbb_forums AS f ON f.id=t.forum_id LEFT JOIN punbb_forum_perms AS fp ON (fp.forum_id=f.id AND fp.group_id=3) WHERE (fp.read_forum IS NULL OR fp.read_forum=1) AND t.id=17305 AND t.moved_to IS NULL |
0.00004 | SELECT search_for, replace_with FROM punbb_censoring |
0.00133 | SELECT u.email, u.title, u.url, u.location, u.use_avatar, u.signature, u.email_setting, u.num_posts, u.registered, u.admin_note, p.id, p.poster AS username, p.poster_id, p.poster_ip, p.poster_email, p.message, p.hide_smilies, p.posted, p.edited, p.edited_by, g.g_id, g.g_user_title, o.user_id AS is_online FROM punbb_posts AS p INNER JOIN punbb_users AS u ON u.id=p.poster_id INNER JOIN punbb_groups AS g ON g.g_id=u.group_id LEFT JOIN punbb_online AS o ON (o.user_id=u.id AND o.user_id!=1 AND o.idle=0) WHERE p.topic_id=17305 ORDER BY p.id LIMIT 0,25 |
0.00085 | UPDATE punbb_topics SET num_views=num_views+1 WHERE id=17305 |
Total query time: 0.00605 s |