Майката на емпетройките
Дигитализацията е имитация.
Ем пе три. Емпетройка. Или както е по-известен музикалният формат в целия свят – mp3. За техничарите това е MPEG Audio Layer-3. Един масово наложил се стандарт в света на цифровата музика. Но не защото е най-добрият, нито защото е най-качественият. А любопитният факт, свързан с неговото развитие, е песента на Сузан Вега “Крайпътният ресторант на Том” (“Tom’s Diner”). За да бъда по-точен – нейното акапелно изпълнение, придобило статут на “майката на емпетройките”.
Тишина и глас
Ето я и нея – песента “Tom’s Diner” в акапелно изпълнение на Сузан Вега (за препоръчване е да я чуете със слушалки и затворени очи):
За нас, преситените от музикални тонове съвременници на 21-ви век, песента не е нищо особено.
Глас и тишина.
Даже няма музика, би възроптал някой днес. Но за Карлхайнц Бранденбург тази песен се превръща в централна тема на професионалните му занимания, без самият той да е предполагал какво ще се случи.
Кой е Карлхайнц Бранденбург?
Карлхайнц Бранденбург е електроинженер и математик, както и един от членовете на групата кинематографични експерти (по известна като MPEG) към института Фраунхофер. Заедно с останалите в групата той разработва популярния формат mp3 за компресия на аудио данни. Поради водещата му роля в проекта днес бива наричан “бащата на емпетройките”. Ето и неговите лични спомени от онзи момент:
“Бях готов за фина настройка на моя алгоритъм за компресиране”, обяснява Бранденбург пред списание “Бизнес 2.0”.
“Някъде надолу по коридора от радиото звучеше (песента на Сузан Вега) “Tom’s Diner”. Почувствах се наелектризиран. Знаех, че ще бъде почти невъзможно да компресирам този топъл глас в акапелно изпълнение.”
Въпреки трудностите и предизвикателствата, Карлхайнц Бранденбург не се отказва, вдъхновен от песента на Сузан Вега. Така изпълнителката и нейната акапелна версия на песента заемат своето място в тази история за технология, алгоритми, дигитализация и имитация.
Игра на имитация
“-Ти истинска ли си?
-Ако не можеш да направиш разликата, има ли значение?”
“Западен свят“
Целта на емпетройката е “достатъчно добро” в малък размер. Тя е дигитално копие на реалния глас и реалната музика.
Имитация.
Ако загубите са незабележими (за повечето хора), то тогава има ли значение? – вероятно ще попитате вие.
За Сузан Вега има. Когато я канят в Института “Фраунхофер” да се срещне с “бащите на емпетройката”, се случва нещо не съвсем очаквано. Ето и нейния разказ за събитията:
“В деня на моето посещeние – “Майката на MP3 идва в дома на MP3!”, каза жената, която ръководи пресата (с леко странното внушение, че аз ще се срещна с няколкото “бащи” на MP3).
Имахме пресконференция, на която възпроизведоха запис на оригиналната версия на песента “Tom’s Diner” и след това няколко развалени версии в MP3 формат, такива, каквито са били в началото, и те звучаха чудовищно и странно. След това, накрая, пуснаха “чистата” версия на песента “Tom’s Diner”.
Хората срещу мен ме гледаха със сияещи усмивки.
“Виждате ли?” каза един от тях. – “Сега емпетройката възпроизвежда песента перфектно. Съвсем същата е!”
“Всъщност, за моите уши звучи сякаш високите честоти са малко по-нагоре в MP3 версията. Емпетройката не звучи така топло както оригинала, може би малко от ниските честоти са изгубени?” – предположих аз.
Човекът ме изгледа шокиран.
“Не, мис Вега, точно същата е!”
“Всички знаят, че mp3 форматът компресира звука и следователно се губи част от топлотата”, настоях аз. “Точно заради това някои хора колекционират винилови плочи…”
Внезапно се спрях, осъзнавайки, че говорех с този човек в стая, пълна с германски медии.
Както се казва, понякога и най-добрите планове на мишките, хората и алгоритмите се провалят…
Е, тази пресконференция не е краят на MP3 формата. Напротив. Емпетройките превземат процеса по дигитализиране и разпространение на музикални произведения и довеждат до глобална трансформация на начина, по който слушаме музика.
Защо MP3?
Защо, обаче, е необходимо музиката да се компресира?
Отговорът е един – ограничения.
Процесът на дискретизация или с други думи – превръщането на аналоговия сигнал в цифров, се сблъсква с ограничения. Най-вече ограничения в мястото за съхранение и ограничения в скоростта на пренос на данни по мрежата. И нещо по-важно, при процеса на дискретизация винаги има дискретизационна грешка, която води до изкривяване.
Този тип изкривяване се нарича “шум на дискретизация” или “алайзинг”. И за да бъде избегнат този негативен ефект, се използва технологията за антиалайзинг. А “единственият начин за отстраняването на алайзинга е предварителната ниско-честотна филтрация на сигналите, посредством която всички съставляващи на спектъра, превишаващи честотата на Найкуист, се отфилтрират.”
MP3 компресията работи чрез редуциране на точността на определени компоненти от звука. Тези компоненти се определят от психоакустичните анализи като излизащи извън слуховия диапазон на човешките възможности.
Казано с други думи, част от звуковия спектър бива премахнат.
В масовия случай резултатът е “достатъчно добро”. Но за онези с развити сетива, като Сузан Вега, загубата на качество се забелязва.
Но защо се връщаме в една отминала епоха, при положение че тогавашните ограничения вече са преодолени? Днес имаме свръхбърз оптичен интернет, терабайти с информация, облачни услуги и алгоритми с Изкуствен интелект. Защо да гледаме назад, след като светлото бъдеще е пред нас?
Изкуственият интелект и емпетройките
Големите езикови модели (LLM – Large Language Models) като ChatGPT доведоха до революция в разпространението на алгоритмите с Изкуствен интелект.
Днес този тесен изкуствен интелект и алгоритмите, които следва, е базиран на дигитализираната информация, на извлеченото от реалността. И в този смисъл неговите избори, решения и действия също са ограничени. Също както емпетройките, тесният изкуствен интелект има потенциала да се разпространи глобално и да навлезе масово в най-различни области на живота. Но изкуственият интелект не може да избегне ограниченията, които всяка една дигитална технология има – загубата на качество.
Големите езикови модели са точно това, което казват че са – модели на реалността. Всички ние носим в умовете си подобни езикови модели на реалността. И твърде често се увличаме в тях дотолкова, че забравяме най-важното – те не са реалността, а само нейно ограничено копие.
Както вече стана ясно, дигиталните технологии разчитат на редукция. Реалният живот е твърде сложен и комплексен и затова бива сведен до математически модели, които могат да бъдат описани формално на разбираем за машините език.
Дигиталният звук е отражение, образ на реалността, но никога не е самата реалност.
И в това е ключовото предимство на човека пред машината. В бъдеще отварянето и усъвършенстването на сетивата, които вече имаме, е възможният път отвъд настоящите ограниченията на телата и умовете ни.
Към настоящия момент архитектите на технокрацията говорят за това колко човекът е примитивен и напълно пренебрегват потенциала, който имаме, а все още не е развит. Единственият път, ни казват те, е да се усъвършенстваме чрез вграждане на технологии в телата ни. А следващата стъпка, казват те, е да променим генетично телата си, да ги направим синтетични или напълно да ги изоставим, като пренесем съзнанието си във виртуалната реалност.
Единственият начин, според тях, да догоним свръх бързото развитие на машинния свръхинтелект, е като се слеем с него.
Пренасянето на съзнанието и емпетройките
Пренасянето (дигитализирането) на съзнанието, ако някога изобщо бъде постигнато, неизменно ще бъде свързано със загуба на информация (качество). Някаква част ще бъде пропусната, изрязана, нещо ще липсва. Също както с емпетройките в масовия случай такова компресиране ще бъде приемливо. Но разликата ще бъде осезаема за онези с изострени сетива.
Майката на емпетройките – Сузан Вега, го е усетила мигновено и го е разбрала интуитивно. Дали и ние като нея ще се вслушаме в собствените си усещания и интуиция или ще предпочетем да следваме предначертания от други път за нас?
Съвсем скоро може да разберем.
***
Използвани източници:
- Чавдар Иванов Дамянов – Основи на кибернетиката.
- Wikipedia – Discretization
- Wikipedia – Discretization error
- Wikipedia – Aliasing
- Wikipedia – Nyquist frequency
- Wikipedia – Large language model
- Уикипедия – Сузан Вега
- Wikipedia – MP3
- Уикипедия – Дискретизация (обработка на сигнали)
No comments