Jak na kompresi mp3 na více jádrech

11. 7. 2008 10:11 (aktualizováno) Petr Krčmář

Software

Přemýšlel jsem nad tím, jak vyřešit vícevláknovou kompresi souborů mp3. Nedávno byla v diskusi debata na toto téma. Bylo to spíš takové hraní, ale pokud vás zajímá jednoduché řešení, nabízím jeho popis.

Když se v diskusích objevilo téma Využití více jader, také jsem přemýšlel, jak elegantně problém vyřešit. Svou ideu jsem v diskusi naznačil. Je jasné, že se nejedná o ideální řešení.

Hodí se ve chvíli, kdy potřebujeme zpracovat hromadu úloh, které nám zaberou přibližně stejnou dobu – tedy ideální například na kompresi mp3. Většina skladeb má totiž podobnou délku a doba jejich zpracování bude velmi podobná.

Před pár dny jsem chtěl zkomprimovat jedno album a tak jsem se rozhodl, že se pustím do psaní skriptu, který mi vše urychlí. Nejde ani tak o ten samotný výkon, ale o to dokázat si, že to jde. Jeden kolega to shrnul slovy: „Aha, takže teď se Ti to album nekomprimuje čtyři minuty, ale dvě a půl“ Je jasné, že výkon počítače není problém. Ale když už tam ta jádra jsou…

Výsledný skript vypadá takto:

#!/bin/bash

ls *.wav|while read "soubor"
do
    echo "Delam mp3 z $soubor"
    nice -19 lame -m j --quiet --vbr-new -b 64 -B 192 "$soubor" "$soubor.mp3" &

    read "soubor"
    if [ -z "$soubor" ]
        then
            wait
            continue
        fi

    echo "Delam mp3 z $soubor"
    nice -19 lame -m j --quiet --vbr-new -b 64 -B 192 "$soubor" "$soubor.mp3" &

    wait
done

Netvrdím, že je to nejlepší řešení. Spíš bych to nazval „proof of concept“ tedy důkaz, že to i takto jde.

Jak to funguje? Nejprve získám z aktuálního adresáře seznam wav souborů, pak na první z nich pustím lame na pozadí. Pak načtu další název a ověřím, jestli jsem něco dostal (pokud by už byl konec seznamu wavů, skript končí). Pokud ano, pak se pustí druhý lame opět na pozadí. Pak přichází klíčový příkaz wait, který čeká, až úlohy na pozadí skončí. Poté, pokud ještě nějaké soubory v seznamu zbývají, se skript opakuje.

Skutečně to funguje, skript po většinu doby vytěžuje obě jádra. Je jasné, že pokud by byla některá skladba podstatně kratší než druhá, došlo by u jednoho jádra k prostoji (čekalo by, až doběhne delší práce), ale na tom mi příliš nesejde.

Jedná se o velmi jednoduché řešení, které prostě funguje. Ve zmiňované diskusi bylo načtrnuto více možností, mě osobně se nejvíce líbil nápad s Make, který je zcela univerzální, netrpí „prostoji“, ale zase na druhou stranu to není o několika řádcích skriptu. Časem ho ale možná taky zkusím realizovat.

Související články na blogu Petr Krčmář: blog nejen o Linuxu
- Tip: šifrování souborů pomocí Vim 21. 2. 2014 20:48
- Zamknutí klávesnice a myši při přehrávání videa 29. 11. 2013 12:37
- Tip: DTRX aneb Do The Right Extraction 7. 8. 2013 13:37
- Rychlá makra v editoru Vim 3. 6. 2013 23:27
- Snadná konverze eknih mezi různými formáty (epub, mobi a další) 7. 11. 2012 21:20
- Dropbox v Debianu a Ubuntu 30. 11. 2011 11:15
Související články na ostatních blozích
- Recenze: Chromebook Education 11 3189 2-in-1 (2017) 30. 12. 2018 1:37
- Samsung Galaxy A5 2017 (zkušenosti uživatele) 27. 2. 2017 23:03
- Jak vypálit Blu-Ray video v Linuxu 19. 8. 2016 20:23
- Změnila se doba, změnilla... 30. 7. 2016 23:34
- Black Tuesday shrnutí: nezáplatovaná 0day pro Flash a 16 bulletinů od Microsoft 15. 6. 2016 13:32
- Já a elektronické knihy aneb přelomový rok 2016 : Výběr 30. 12. 2015 18:03

Přidat názor

11. 7. 2008 11:32

Aleš Janda (neregistrovaný)

Dovolil bych si navrhnout ještě jedno řešení, pro libovolný počet procesorů:
priorita=1 for soubor in $(ls -S1 *.wav); do nice -$priorita lame -m j --quiet --vbr-new -b 64 -B 192 "$soubor" "$soubor.mp3" & if [ $priorita -lt 19 ]; then priorita=$(($priorita+1)) fi done
To udělá to, že se pokusí všechny soubory převést najednou a ať si to procesory mezi sebou už nějak rozdělí. Kromě toho se začne těmi největšími soubory (a mají také nejvyšší prioritu), takže je menší pravděpodobnost, že se bude na nějakou dlouhou písničku čekat. Nevýhoda: load se zvedne na číslo počtu písniček :-) Ale nezkoušel jsem, nevím jak moc to vadí, když všechny procesy mají i tak nízkou prioritu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 7. 2008 13:55

kvr (neregistrovaný)

Mno, je vidět, že shell je spíš tak hraní. Když se použije jazyk s rozumným interface na systém, tak se z toho dá vytáhnout víc ;)

Mám doma něco podobného v perlu, který si zajistí vše od stáhnutí z CD, ke kompresi, nastavení tags, o možnosti výběru mezi ogg/mp3 samozřejmě ani nemluvě. Počet paralelně běžících kompresí je samozřejmě nastavitelný, další se pouští okamžitě, nikoli poté, co doběhnou všechny běžící.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 7. 2008 14:02

Martin Beránek (neregistrovaný)

Dovolil bych si nevymýšlet kolo:

echo '
all : $(patsubst %.txt,%.out,$(wildcard *.txt))

%.out : %.txt
cat $ $@
' | make -j 2 -f -

parametrem -j pak stačí změnit počet paralelních procesů
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 7. 2008 14:04

Martin Beránek (neregistrovaný)

tak ještě jednou:

echo '
all : $(patsubst %.txt,%.out,$(wildcard *.txt))

%.out : %.txt
cat $< $@
' | make -j 2 -f -
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 7. 2008 14:21

pht (neregistrovaný)

3> spravne. pokud chceme paralelizovat takto primitivni veci, nejlepe je pouzit nastroj make.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 7. 2008 17:28

Jirka P (neregistrovaný)

A co na jeden řádek?

ls *.mp3 | xargs -L 1 -I {} -P 2 lame -m j --quiet --vbr-new -b 64 -B 192 {} {}.mp3
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 7. 2008 21:07

Petr Krčmář (neregistrovaný)

[6] Tak tohle je geniální, vůbec jsem o parametru -P nevěděl. Naprosto skvělé, díky.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 7. 2008 22:26

JardaP (neregistrovaný)

Nedostatkem je, ze se napred to CD musi vyripovat a to nikoliv paralelne na dvou procesech. Nevim, co timhle postupem usetrim napr. proti Kaudiokreatoru, ktery na jedne strane ripuje, na druhe pak vyripovane tracky rve do fronty, odkud si je bere lame, jak stiha. Navic jeste ty tracky otaguje podle freedb, coz tenhle skript asi neudela, protoze nevim, odkud by ty tagy vydoloval, z wavu asi tezko.

Cili postup je takovyto: Vyripovat a pekne pockat, az to dojede do konce, namisto aby se zacalo kodovat, jakmile je prvni track ripnuty. Pak si to zrychlene zakodovat ve dvou procesech. Nasledne uz jen rucne otagovat, coz bude trvat rekneme pul hodiny.

Cili se jedna opravdu o proof of concept, kterym si clovek akorat pridela praci a vse pekne prodlouzi, i kdyz, dluzno poznamenat, faze kodovani bude kratsi. :-)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
12. 7. 2008 18:33

disposable (neregistrovaný)

wavy nevznikaju len z CD. moje Asterisky v praci denne nahraju aj 10000 G711 hovorov do nekomprimovanych wavov. mam cron job ktory to potom vsetko zmasti do mp3 (VBR 9). (teda 2 cron joby, lebo to chcem mat beziace dvoch jadrach)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 7. 2008 11:15

ferda (neregistrovaný)

kdysi jsme paralelne komprimoval wav do mp3 na linuxovem clusteru, stacilo skriptem spustit na jednotlivych uzlech lame pomoci rsh, kazdy uzel jedna pisnicka a cele album bylo na dostatecnem poctu stroju/procesoru udelano
najednou.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 7. 2008 11:31

dvop (neregistrovaný)

[9] To mi prijde jako skoda mista - skladovat wav. Zkusil bych ukladat primo g711 a pak konvertovat rovnou. Lame se teda musi prelozit s podporou libsndfile (http://www.mega-nerd.com/libsndfile/).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 7. 2008 11:50

disposable (neregistrovaný)

[11] skoda ze to nepozna g729. (holt licencie su licencie)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 7. 2008 20:23

Kaa (neregistrovaný)

hmm .. na mp3 bezny clovek zustane u klasiky, uz kvuli id3tagum ..
Ale koukam ze bych mel pohnout zadnici a dorazit davkove xvidovani nahravek z dvbt. S optimalnim vyuzitim multicpu. Ten radek s xarg se mi libi :-)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
22. 2. 2009 9:38

petr (neregistrovaný)

davkove xvidovani? a neni to skoda prace?
neni lepsi bud to udelat necim poradnym, a tedy pouzit h264 nebo to udelat v co nejlepsi kvalite (vzhledem o originalu) a tedy jen t prevest do DVD video, coz je o zmene hlavicek a indexaci a s videem se pak nedeje nic.

Přidat názor

Sdílet

Související články na blogu Petr Krčmář: blog nejen o Linuxu

Tip: šifrování souborů pomocí Vim 21. 2. 2014 20:48

Zamknutí klávesnice a myši při přehrávání videa 29. 11. 2013 12:37

Tip: DTRX aneb Do The Right Extraction 7. 8. 2013 13:37

Rychlá makra v editoru Vim 3. 6. 2013 23:27

Snadná konverze eknih mezi různými formáty (epub, mobi a další) 7. 11. 2012 21:20

Dropbox v Debianu a Ubuntu 30. 11. 2011 11:15

Související články na ostatních blozích

Recenze: Chromebook Education 11 3189 2-in-1 (2017) 30. 12. 2018 1:37

Samsung Galaxy A5 2017 (zkušenosti uživatele) 27. 2. 2017 23:03

Jak vypálit Blu-Ray video v Linuxu 19. 8. 2016 20:23

Změnila se doba, změnilla... 30. 7. 2016 23:34

Black Tuesday shrnutí: nezáplatovaná 0day pro Flash a 16 bulletinů od Microsoft 15. 6. 2016 13:32

Já a elektronické knihy aneb přelomový rok 2016 : Výběr 30. 12. 2015 18:03

Petr Krčmář

Nejčtenější články autora

Poslední názory

Témata