Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!

Ogłoszenie

Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.

#26  2014-11-02 17:11:15

  prosze - Użytkownik

prosze
Użytkownik
Zarejestrowany: 2012-09-25

Re: [regex, bash, sed] Masowa modyfikacja plików

Wszystko jasne, ale jak zwykle diabeł tkwi w szczegółach. Chodzi o to, że fragment 1 Twojego kodu przepuszczony przez awk traci formatowanie i wygląda tak

Kod:

753 0 obj (if \(this.hostContainer\) { try { this.hostContainer.postMessage\(['newPage', 'pp_376', 15259]\); } catch\(e\) { console.println\(e\); }};)

Jak widzisz zapisany jest on w jednej linii. Teraz pytanie. Czy ten kod może być zapisany w jednej linii i czy po zmianie fragmentu 1 na fragment 2 może wyglądać tak?

Kod:

753 0 obj (this.zoomType = zoomtype.pref; this.pageNum = 360;)

Offline

 

#27  2014-11-02 17:32:06

  menteith - Użytkownik

menteith
Użytkownik
Zarejestrowany: 2008-03-31

Re: [regex, bash, sed] Masowa modyfikacja plików

Wygląda, że nie musi być nowy wiersz, a wystarczy spacja. Ale mogę się mylić. Zobacz dla pewności plik pod tym adresem: [url]http://pl.rghost.net/58848774[/url]
Zmieniony kod teraz każe skoczyć do strony nr 1 (w kodzie strona 0, bo strony w JavaScripcie liczą się od 0 w pdfach). Wystarczy kliknąć na 31, przy Sir John A. w pdfie. W pliku pdf zmieniony kod jest w lini 6242.

Offline

 

#28  2014-11-02 18:26:50

  prosze - Użytkownik

prosze
Użytkownik
Zarejestrowany: 2012-09-25

Re: [regex, bash, sed] Masowa modyfikacja plików

U mnie ten zmieniony kod wygląd tak

Kod:

/JS (this.zoomType = zoomtype.pref; this.pageNum = 0;)

czyli przed nawiasem jest jeszcze "/JS"
Czy wszystkie pliki .pdf masz już rozpakowane? W jaki sposób liczyłeś w ilu liniach masz zmienić kod?

Ostatnio edytowany przez prosze (2014-11-02 18:27:25)

Offline

 

#29  2014-11-02 18:45:00

  menteith - Użytkownik

menteith
Użytkownik
Zarejestrowany: 2008-03-31

Re: [regex, bash, sed] Masowa modyfikacja plików

Może tak być, tzn. może pojawiać się /JS. Te pliki pdf są dziwnie skonstruowane. Czasami po rozpakowaniu jest dostęp do JavaScripu  - widać go w edytorze, czasami nie. Gdy nie ma, wystarczyć lekko zmienić kod JavaScrpt z poziomu Adobe Acrobat albo  z pluginu [url]http://www.evermap.com/abm_lnk_summary.asp#Editing%20existing%20Link%20and%20Bookmark%20Actions[/url], zapisać plik, ponownie go odkompresować i pojawia się JavaScript w czystym tekście. Te modyfikacje wpływają na strukturę PDF, stąd czasami jest /JS, czasami nie. Ale to nie ma znaczenia. Wystarczy znaleźć:

[b]Kodzik[/b]

Kod:

if (this.hostContainer) { 
    try {
        this.hostContainer.postMessage(['newPage', 'pp_322', 15259]);
    } 
    catch(e) { 
        console.println(e); 
    }
};

i zamienić na

Kod:

(this.zoomType = zoomtype.pref; this.pageNum = 322-16)

Inaczej mówiąc, najlepiej szukać całego  [b]Kodzik[/b] (to co pp_ się zmienia, tak jak pisałem, cyfry rzymskie, arabskie itd.) i zmienić na to co wyżej (chodzi o kod wyżej z wynik odejmowania 322-16 po pp_)


[quote=prosze]Czy wszystkie pliki .pdf masz już rozpakowane? W jaki sposób liczyłeś w ilu liniach masz zmienić kod?[/quote]
Napisałem sobie skrypt do rozpakowywania plików, więc to chwila i mam wszystko rozpakowane. A występowanie pp_CYFRA_ARABSKA liczyłem za pomocą plugina wyżej przy użyciu regexa

Kod:

(?<=pp_)\d+(?:\'\d+)?

Ponieważ struktura PDFów (czasami JavaScript widoczny, czasami nie) jest nieco zmienna (chyba spis treści i indeksy mają jakiś zakamuflowany ten JavaScript), cięzko zatem podać dokładną liczbę wystąpień tego, co chcę zamienić.

Ostatnio edytowany przez menteith (2014-11-02 18:50:43)

Offline

 

#30  2014-11-02 21:38:48

  prosze - Użytkownik

prosze
Użytkownik
Zarejestrowany: 2012-09-25

Re: [regex, bash, sed] Masowa modyfikacja plików

To teraz sprawdzimy ile jest wszystkich linii, które należy zmienić. Zrób tak. Wejdź do katalogu w którym masz rozpakowane pliki .pdf (jeżeli jeszcze ich nie rozpakowałeś to je rozpakuj) i wydaj takie polecenie

Kod:

awk '/pp_/{a++; print $0, a}' $(for x in *.pdf; do echo "$x"; done) > wynik.txt

Plik "wynik.txt" wrzuć na hosting plików.

Offline

 

#31  2014-11-03 18:34:32

  menteith - Użytkownik

menteith
Użytkownik
Zarejestrowany: 2008-03-31

Re: [regex, bash, sed] Masowa modyfikacja plików

Polaczylem wszystkie pliki do jednego - w pluginie do Acrobata wyszło mi, że skasowało 3112 linków - ale nie ma pewności, czy wszystkie to pp_ .

Plik jest tutaj: http://pl.rghost.net/private/58868045/40d056afb72613dc121c421fe7481876

Offline

 

#32  2014-11-05 22:52:11

  prosze - Użytkownik

prosze
Użytkownik
Zarejestrowany: 2012-09-25

Re: [regex, bash, sed] Masowa modyfikacja plików

Do tematu wrócimy za kilka dni ponieważ w tej chwili jestem poza domem.

Offline

 

#33  2014-11-06 13:02:35

  menteith - Użytkownik

menteith
Użytkownik
Zarejestrowany: 2008-03-31

Re: [regex, bash, sed] Masowa modyfikacja plików

Jasne, to to wracamy za parę dni.

Offline

 

#34  2014-12-05 15:16:11

  prosze - Użytkownik

prosze
Użytkownik
Zarejestrowany: 2012-09-25

Re: [regex, bash, sed] Masowa modyfikacja plików

Rozwiązałeś już swój problem?

Offline

 

#35  2014-12-07 11:48:53

  menteith - Użytkownik

menteith
Użytkownik
Zarejestrowany: 2008-03-31

Re: [regex, bash, sed] Masowa modyfikacja plików

Niestety nie.

Offline

 

#36  2014-12-07 12:37:36

  prosze - Użytkownik

prosze
Użytkownik
Zarejestrowany: 2012-09-25

Re: [regex, bash, sed] Masowa modyfikacja plików

To wykonaj jeszcze raz czynności z postu o numerze 30.

Offline

 

Stopka forum

Powered by PunBB
© Copyright 2002–2005 Rickard Andersson
To nie jest tylko forum, to nasza mała ojczyzna ;-)

[ Generated in 0.010 seconds, 11 queries executed ]

Informacje debugowania

Time (s) Query
0.00008 SET CHARSET latin2
0.00003 SET NAMES latin2
0.00091 SELECT u.*, g.*, o.logged FROM punbb_users AS u INNER JOIN punbb_groups AS g ON u.group_id=g.g_id LEFT JOIN punbb_online AS o ON o.ident='18.119.107.159' WHERE u.id=1
0.00084 REPLACE INTO punbb_online (user_id, ident, logged) VALUES(1, '18.119.107.159', 1732241269)
0.00040 SELECT * FROM punbb_online WHERE logged<1732240969
0.00046 SELECT topic_id FROM punbb_posts WHERE id=278537
0.00005 SELECT id FROM punbb_posts WHERE topic_id=26631 ORDER BY posted
0.00052 SELECT t.subject, t.closed, t.num_replies, t.sticky, f.id AS forum_id, f.forum_name, f.moderators, fp.post_replies, 0 FROM punbb_topics AS t INNER JOIN punbb_forums AS f ON f.id=t.forum_id LEFT JOIN punbb_forum_perms AS fp ON (fp.forum_id=f.id AND fp.group_id=3) WHERE (fp.read_forum IS NULL OR fp.read_forum=1) AND t.id=26631 AND t.moved_to IS NULL
0.00008 SELECT search_for, replace_with FROM punbb_censoring
0.00328 SELECT u.email, u.title, u.url, u.location, u.use_avatar, u.signature, u.email_setting, u.num_posts, u.registered, u.admin_note, p.id, p.poster AS username, p.poster_id, p.poster_ip, p.poster_email, p.message, p.hide_smilies, p.posted, p.edited, p.edited_by, g.g_id, g.g_user_title, o.user_id AS is_online FROM punbb_posts AS p INNER JOIN punbb_users AS u ON u.id=p.poster_id INNER JOIN punbb_groups AS g ON g.g_id=u.group_id LEFT JOIN punbb_online AS o ON (o.user_id=u.id AND o.user_id!=1 AND o.idle=0) WHERE p.topic_id=26631 ORDER BY p.id LIMIT 25,25
0.00096 UPDATE punbb_topics SET num_views=num_views+1 WHERE id=26631
Total query time: 0.00761 s