Aby możliwe było porównanie brzmienia kopii fortepianów Waltera, Pleyela oraz odrestaurowanego, zabytkowego Marty’ego, nagrane zostały próbki pojedynczych dźwięków każdego instrumentu na różnych stopniach dynamicznych oraz z użyciem dostępnych w poszczególnych modelach modyfikatorów – moderatorów, registrów, pedałów, dźwigni. W ramach tego porównania chcieliśmy zbadać przede wszystkim różnice barwowe i dynamiczne, jakie nastąpiły w wyniku intensywnych przemian w budowie fortepianów na przełomie XVIII i XIX wieku. Oprócz próbek dźwiękowych (sampli) trzech instrumentów historycznych badanych wcześniej pod kątem wykonawczym jako punkt odniesienia wzięte zostały pod uwagę również próbki instrumentów bardziej współczesnych – tzw. fortepian Noskowskiego, czyli Krall & Seidler z roku ok. 1890 z ostromeckiej kolekcji, a także instrument wirtualny Grandeur firmy Native Instruments bazujący na fortepianie marki Steinway&Sons (choć oficjalnie nie jest to nigdzie przyznane ze względów marketingowych) z ustawieniami domyślnymi. Nagrane sample zostały przy okazji wykorzystane do stworzenia autorskich instrumentów wirtualnych, co zostało opisane w osobnym rozdziale.
Porównując brzmienie fortepianów nie opierałem się wyłącznie na wrażeniach słuchowych. Podstawowym narzędziem był w tym badaniu wielokanałowy analizator widma. Użyłem do tego celu pluginu Oscarizor firmy Sugar Audio, który posiada wszelkie niezbędne parametry oraz wizualizery widma poszczególnych ścieżek nakładane na siebie. Dzięki temu wyłapywanie różnic w zawartości spektrum było dużo prostsze.
Omikrofonowanie zastosowane podczas nagrań próbek nie różniło się od tego, które było użyte w realizacji nagrań z wykonawcami. Nagrania były wykonywane w tym samym terminie i na tym samym sprzęcie. Na etapie obróbki materiałów i przygotowania do analizy spektralnej niezbędne było ustalenie priorytetów i uświadomienie sobie rozmaitych właściwości miksu, wpływu ustawienia poszczególnych par mikrofonów na zawartość sygnału i różnic między kanałami w zastosowanej technice stereo, itp., które mogłyby wpłynąć na kształt widma. Nie oceniam przestrzenności i stereofoniczności dźwięku podczas oceniania barwy – tym bardziej, że jest ona silnie zależna od zastosowanej techniki mikrofonizacji i bliskości do źródła. Doszedłem do wniosku, że najpraktyczniejsze będzie porównywanie wykresów spektrum w trybie mono, na podobnej zasadzie jak badane jest np. pasmo przenoszenia głośników. Fortepian jednak nie jest punktowym źródłem dźwięku i nie da się w nim wyznaczyć jakiejś jednej osi – perspektywy, z której dźwięk jest referencyjny całościowo dla instrumentu. Musiałem zatem znaleźć jakieś rozwiązanie uśredniające spektrum z różnych punktów przestrzeni dźwiękowej. Oczywiście prosta monofonizacja nie wchodziła tutaj w grę. Nie zakładałem również, że będę wykorzystywał do badań sygnały z wszystkich mikrofonów. Musiałem dokonać wyboru. Z pewnością niepożądany był wpływ akustyki pomieszczenia na wyniki. Instrumenty nie znajdowały się w komorze bezechowej, lecz kameralnych salach. Bliska para AB z pewnością była najbardziej wolna od wpływu akustyki pomieszczenia, a sygnał z pary najdalszej wykazywał ten wpływ w największym stopniu. Wziąłem więc najbliższą parę jako pierwszą do rozważenia.
W bliskiej parze AB najbardziej “uprzywilejowane” pod kątem szczegółowości będą struny znajdujące się dokładnie na osi 0 st. charakterystyki kierunkowej mikrofonów (kardioidalna). Dźwięk pochodzący z tej samej struny będzie miał nieco inne spektrum gdy porównamy oba mikrofony bliskiej pary AB. Na jednym z nich będzie on nieco bardziej szczegółowy, lepiej zarejestrują się na nim mikrodrgania uderzonej struny i rezonanse sąsiadujących strun. Proste zmonofonizowanie pary AB spowoduje pojawienie się filtra grzebieniowego z powodu różnicy opóźnień, dlatego stwierdziłem, że najprostszym rozwiązaniem będzie ustalenie za pomocą goniometru (używałem wtyczki Waves PAZ Position), w którym miejscu to opóźnienie między mikrofonami się zrównuje – czyli, która struna znajduje się w identycznej odległości od obu mikrofonów, a następnie wg tego podziału wybierać odpowiedni dla danej połowy rejestru sygnał z jednego mikrofonu. Takie były moje wstępne założenie, które, jak się okazało podczas przeglądania i interpretacji zarejestrowanych materiałów, musiało zostać nieco skorygowane, o czym będę pisał nieco dalej.
Sygnały z bliskiej pary mikrofonów nie mogły być jedyną perspektywą wziętą pod uwagę. Słuchacze ani pianiści raczej nie oceniają brzmienia instrumentu trzymając głowy nad strunami pod klapą pudła fortepianu. A właśnie taka nienaturalna perspektywa była zarejestrowana za pomocą bliskiej pary AB. Zwykle odsłuch odbywa się to w pewnym oddaleniu. W przypadku fortepianów historycznych to oddalenie nie może być jednak zbyt duże, bo są to instrumenty niezbyt nośne. Poza tym, jak wspomniałem wcześniej, starałem się uniknąć akustyki samego pomieszczenia. Do dyspozycji pozostały mi jeszcze para ORTF z punktu widzenia pianisty, para XY w średnio-bliskim planie i para AB w planie średnio-dalszym (w przypadku Marty’ego był to układ MS). Najbardziej uśredniona brzmieniowo, obejmująca swoim zasięgiem w sposób zrównoważony całą część akustyczną instrumentu oraz nie zawierająca istotnego wpływu akustyki pomieszczenia wydała mi się para XY. W dodatku monofonizowanie XY nie powinno spowodować znaczących problemów fazowych. Nie chciałem jednak całkowicie zatracić w badaniu porównawczym szczegółowości spektrum, którym charakteryzowały się mikrofony AB umieszczone najbliżej strun. Postanowiłem zatem, że przy zestawianiu wykresów będę brał pod uwagę obydwa ujęcia, ale nie miksowane ze sobą (monofonizowane), ponieważ miałyby wtedy miejsce problemy z opóźnieniami wpływające na widmo. Gdybym chciał uzyskać zmiksowaną z tych ujęć i zgraną w jedną ścieżkę postać próbki do analizy w mono to musiałbym równać ścieżki z dokładnością do sampla oddzielnie dla każdego dźwięku, bo struny znajdują się za każdym razem w innych odległościach od mikrofonów. A i to nie dałoby pewności, że jakieś wyższe harmoniczne albo rezonanse pochodzące z wpływu innych strun, obudowy itp. by się przy tym zabiegu nie zniosły lub podbiły. Zmierzone przesunięcia fazowe między ujęciami były rzędu 1-2 ms. Na szczęście, używany przeze mnie do analizy spektralnej plugin Oscarizor umożliwia badanie na raz wielu źródeł dźwięku prezentując wyniki w jednym oknie w wybranej postaci (widoki 2D, 3D). Mogłem zatem na oddzielne wejścia wysłać obydwa ujęcia mikrofonowe i zaobserwować różnice między nimi, jednocześnie porównując je z ich odpowiednikami dla innego instrumentu. Przykładowo, przy okienku analizatora widma 2048 sampli pomiar następuje na odcinku ok. 43 ms, dlatego przesunięcia rzędu 1-2 ms nie mają wpływu na wynik pomiaru. Przy nakładaniu wizualizacji spektrum na siebie znajdujemy się w tym samym zagregowanym momencie (zbiorze sampli – okienku) obwiedni dźwięku.
Porównanie brzmienia fortepianów ma oczywiście sens tylko z zachowaniem tej samej dynamiki. Trudno jednak odnosić się w tym wypadku do parametrów wyłącznie akustycznych i porównywać ze sobą nagrania wyznaczając np. jakieś określone w dB natężenie dźwięku. Różnice dynamiczne między poszczególnymi historycznymi fortepianami, a już tym bardziej współczesnymi, są ogromne. Każdy instrument ma swoją własną rozpiętość dynamiczną, swoje własne pianissimo i fortissimo. Jeśli chcemy porównać brzmienie w tej samej dynamice to najbardziej naturalne wydaje się odniesienie do siły nacisku klawisza, a nie do ilości dB wyzwalanych przez instrument. Konieczne było przeskalowanie rozpiętości dynamicznej każdego z fortepianów – zamiana parametrów akustycznych na muzyczne (piano-mezzoforte-forte). Każdy dźwięk podczas nagrań został spróbkowany na 4-6 poziomach dynamicznych, które ściśle wiązały się z tym jak mocno klawisz został wciśnięty. Klawiszy nie wciskał jednak robot z precyzyjnymi czujnikami, lecz człowiek. Dlatego przy tworzeniu instrumentów wirtualnych przypisanie sampli do odpowiednich wartości 1-127 Velocity (siły nacisku klawisza) nie było rzeczą łatwą. Dla każdego dźwięku wartości te były nieco inne, określane w sposób doświadczalny, podobnie jak stroiciel koryguje reakcję klawiszy. Mierzalna amplituda sygnału była w tym wypadku pewną podpowiedzią.
Dla zachowania przejrzystości badania ograniczyłem ilość próbek poszczególnych dźwięków do piano (klawisz wciśnięty najlżej), mezzoforte (klawisz wciśnięty z przeciętnym wysiłkiem) oraz forte (klawisz wciśnięty najmocniej). Na wykresach porównujących brzmienia poszczególnych fortepianów użyte zostały próbki w dynamice mezzoforte. Klawisze pozostawały wciśnięte aż do całkowitego wybrzmienia dźwięku. Próbki w piano i forte były używane przy porównywaniu różnic w ramach tego samego instrumentu – długości wybrzmiewania dźwięku jako całości, a także jego poszczególnych składowych.
Badając spektrum na wielokanałowym analizatorze Oscarizor mamy możliwość wygodnego dopasowania amplitudy dźwięku z poszczególnych źródeł. Dzięki temu nakładając na siebie widma można lepiej zauważyć wizualnie wszelkie różnice w wyższych harmonicznych, które wpływają na odbieraną przez nas barwę dźwięku. Punktem odniesienia powinna być dla nas amplituda tonu podstawowego określającego wysokość dźwięku. W ten sposób korygowałem różnice głośności między samplami poszczególnych fortepianów. W badaniu różnic barwy między piano a forte w ramach jednego instrumentu nie stosowałem takiej korekty, aby możliwe było sprawdzenie przybliżonej rozpiętości dynamicznej w dB.
Z wysokością dźwięku (tonu podstawowego i harmonicznych) wiąże się dodatkowe utrudnienie – niejednakowy strój instrumentów historycznych, który powoduje przesunięcie (offset) na osi częstotliwości przy badaniu tych samych “muzycznych” wysokości.
Tabela 2. Strój badanych instrumentów.
Instrument | Strój (a1 = …) |
Walter | 415 Hz |
J. F. Marty | 425 Hz |
Pleyel | 434 Hz |
Krall & Seidler | 440 Hz |
NI Grandeur (Steinway&Sons) | 440 Hz |
Różnica między Walterem a Krall&Seidlerem lub wirtualnym NI Grandeur sięga aż 25 Hz przy dźwięku a1, czyli ok. 101 centów tj. pół tonu. Teoretycznie mógłbym zatem porównywać ze sobą dźwięki np. ais1 Waltera i a1 Krall&Seidlera jako tą samą wysokość – gdyby brać pod uwagę tylko zgodność częstotliwości. Zdecydowałem jednak, że będę się trzymał tego co wyznaczają klawisze, a przesunięcie w osi częstotliwości będę uwzględniał podczas opisu wykresów porównawczych. Z praktycznego punktu widzenia te przesunięcia sprawiły, że wykresy stały się czytelniejsze i łatwiej było zaobserwować różnice amplitud poszczególnych alikwotów.
Aby zniwelować najniższe częstotliwości – infradźwięki (DC Offset), które wpływały na obraz spektrum (zwłaszcza na transjent początkowy), a nie wynikały z samego instrumentu, użyłem liniowego fazowo filtra dolnozaporowego Waves LinEQ Lowband ustawionego na ok. 23 Hz ze spadkiem ok. -12 dB/okt. Stosowanie zwyczajnych filtrów – nieliniowych fazowo – momentalnie objawiało się rozmaitymi przesunięciami fazowymi, a nawet odwracaniem się fazy niektórych częstotliwości, co przy miksowaniu i monofonizowaniu ścieżek mogło zniekształcić wyniki pomiaru. Dlatego zdecydowałem się na wspomnianą wyżej wtyczkę, która sprawdziła się bardzo dobrze w przeprowadzonym teście (zduplikowanie śladu bez obróbki i puszczenie go razem z obrobionym w przeciwfazie -> powinna być całkowita cisza + częstotliwości poniżej 23 Hz). Waves LinEQ faktycznie nie zmieniło pozostałych pasm. Nie stosowałem filtra dolnozaporowego w samplach porównawczych pedału una corda z barwą podstawową ze względu na obserwację LFO wynikającego z tonów różnicowych między poszczególnymi strunami chóru.
W pierwszej kolejności zabrałem się za przygotowywanie do analizy próbek fortepianu Walter. Tak jak założyłem na wstępie, musiałem wybrać, który mikrofon z bliskiej pary AB będzie “dominującym” i wykorzystanym do określenia spektrum, tzn. na którym dźwięku znajduje się punkt podziału. Podczas konfrontacji z nagraniami okazało się jednak, że moje oczekiwania nieco rozmijają się z tym co założyłem podczas ustawiania mikrofonów względem strun (starałem się by w równej odległości od obu mikrofonów znajdowały się struny środkowego rejestru). Na zarejestrowanych próbkach oprócz drgania strun znalazły się także inne komponenty brzmienia tj. rezonanse obudowy, odbicia od klapy, stuk w klawisze (który w tym instrumencie jest szczególnie głośny w stosunku do dźwięku drgań struny), itp. Te dodatkowe zabarwienia nie rozkładały się równomiernie w stereofonii powodując ciążenie widoczne na goniometrze – większa amplituda zarejestrowała się za pomocą mikrofonu znajdującego się bliżej niskich strun (i odbijającej klapy) nawet w sytuacji gdy grane były dźwięki wyższe. Przedwzmacniacze były wysterowane w identyczny sposób, a mikrofony były parowane przez producenta (Neumann U87). Wyraźny przeskok w stereofonii (biorąc pod uwagę całościową amplitudę sygnału) między lewo a prawo pojawił się dopiero między dźwiękami cis3 i d3. Aby lepiej zaobserwować tą część pasma, która szczególnie mnie interesowała przy określaniu widma poszczególnych dźwięków i zweryfikować z czego wynika to ciążenie, zastosowałem delikatny filtr dolnozaporowy z częstotliwością zależną od wysokości tonu podstawowego. Jak się okazało, niskie częstotliwości znajdujące się w sygnale wynikające przede wszystkim z odpowiedzi obudowy na stuk w klawisz i impulsowy transjent początkowy rozchodzący się po instrumencie, były główną przyczyną tego skrzywienia. Dźwięki aż do cis3 miały wyższe amplitudy niektórych pasm (nawet tych powyżej tonu podstawowego) z mikrofonu bliżej klapy i niskich strun. Postanowiłem zatem zweryfikować swoje początkowe założenia i nie przyjmować środka klawiatury za domyślny punkt podziału. Zamiast dzielić próbki na dwa rejestry – bliższe raz jednemu raz drugiemu mikrofonowi, postanowiłem wyodrębnić trzy rejestry: niski, środkowy i wysoki oraz traktować je odrębnie w dalszych rozważaniach.
Rejestr niski ma bez wątpienia bogatsze widmo na bliższym mikrofonie (A). Jednak przy podniesionych wszystkich tłumikach zaczynają się pojawiać rezonanse pozostałych strun, które niekoniecznie w pełnej krasie są wychwytywane przez ten pojedynczy mikrofon i sygnał z mikrofonu (B) zaczyna nabierać na znaczeniu. Do tego dochodzą jeszcze odbicia od obudowy, które powodują dodatkowe rozproszenie fal akustycznych i mniejszą przewidywalność. Gdy uderzymy w strunę średniego rejestru, a zwłaszcza z pedałem podnoszącym wszystkie tłumiki to okaże się, że rezonanse niższych strun są nie mniej znaczące dla brzmienia niż sama uderzona struna. Odbicia od klapy są w tym paśmie najsilniejsze, co uwidacznia się na mikrofonie A. Najwyższy rejestr, co wynika z konstrukcji instrumentu, odbierany jest bardziej bezpośrednio przez słuchaczy – ze strun, a mniej z odbić od klapy. Klapa odbija ten rejestr w minimalnym stopniu, bo znajduje się nad nim znacznie wyżej lub wcale, jest powierzchnią płaską, nie wystającą poza instrument, nie “soczewkującą”. Struny wysokich rejestrów znajdują się ponadto fizycznie bliżej słuchaczy. Najwyższy rejestr nie powoduje tak mocnych rezonansów obudowy, płyty rezonansowej i innych elementów akustycznych. Po namyśle związanym z tymi obserwacjami uznałem, że podział – wybór mikrofonu z pary bliskiej – A czy B nie powinien być uzależniony ściśle tylko i wyłącznie od odległości obu mikrofonów względem strun (opóźnienia sygnału, zgodności fazy w początkowym transjencie, gdy struna zostaje zaatakowana przez młotek), jeśli już chcielibyśmy wybierać tylko jeden z mikrofonów to powinno to zależeć od samego kształtu widma – amplitudy poszczególnych pasm, zwłaszcza powyżej tonu podstawowego. Wychodzę tutaj z założenia, że skoro na jednym mikrofonie jakaś częstotliwość się pojawiła, a na drugim nie, to bliżej prawdy będziemy wtedy gdy ją uwzględnimy w wykresie spektrum. Taka skrajna sytuacja – całkowitego braku pewnych pasm jest oczywiście raczej niemożliwa – różnice będą przede wszystkim w amplitudach poszczególnych składowych. Z drugiej strony, jeśli rezonanse okazują się w pewnych punktach przestrzeni dźwiękowej głośniejsze od niektórych składowych drgań strun to znaczy, że dla całościowego odbioru brzmienia, a takie chcielibyśmy zbadać, mogą one być istotniejsze z punktu widzenia słuchacza. Nie ma sensu jednak rozstrzygać co z bliskiego planu usłyszy słuchacz przed fortepianem – czy więcej strun czy więcej rezonansów itp., bo mamy przecież jeszcze nieco dalszy punkt “słyszenia” – parę mikrofonów XY, która może nam posłużyć do tego typu weryfikacji. Chciałbym się skupić zatem, aby z pary bliskiej wyciągnąć dla wszystkich rejestrów w ten sam sposób możliwie najbogatsze widmo, bez zagłębiania się z jakiego kierunku dana częstotliwość pochodzi – czy bezpośrednio ze struny czy rozmaitych rezonansów i odbić.
Doszedłem do wniosku, że oba sygnały z mikrofonów pary bliskiej AB powinny być analizowane osobno (a nie monofonizowane by uniknąć fazowania), lecz żeby wynikiem graficznym było dodanie się tych wykresów do siebie z zachowaniem maksymalnych szczytów amplitudy. Plugin Oscarizor daje kilka możliwości interpretacji sygnałów stereo – widok dwóch niezależnych wykresów jeden pod drugim L-R lub w trybie MS oraz jeden wykres określony jako “Avg sum” – jest to wykres uśredniony przez proste zmonofonizowanie sygnałów lewego i prawego (tego właśnie nie chcemy). Domyślnie, gdy wszystkie powyższe opcje są wyłączone pokazywany jest także pojedynczy wykres, ale nie miałem pewności czy jest to właśnie oczekiwane przeze mnie nałożenie dwóch niezależnie zbadanych sygnałów lewego i prawego. Ponieważ instrukcja pluginu Oscarizor nie dawała jednoznacznej odpowiedzi postanowiłem przeprowadzić testowe pomiary. Na początek wygenerowałem dwie fale sinusoidalne o różnych częstotliwościach wysyłając każdą do osobnego kanału. Na wykresie pojawiły się obie fale, a nie np. tylko ta z lewego kanału. Miałem więc pewność, że oba kanały są na reprezentowane na tym pojedynczym wykresie. W drugiej kolejności wygenerowałem dwie fale sinusoidalne o identycznej częstotliwości i amplitudzie, ale przesunięte o 180 stopni w fazie między lewym a prawym kanałem. W domyślnym widoku fala się pojawiła, a po włączeniu opcji “Avg sum” monofonizującej lewy i prawy kanał – zgodnie z przewidywaniem częstotliwość zniknęła z wykresu. Ostatnim krokiem było sprawdzenie jak zachowują się na wykresie amplitudy, gdy dla lewego i prawego kanału są one różne przy tej samej częstotliwości, tzn. czy są one w jakiś sposób uśrednione czy po prostu jest pokazywana wyższa jej wartość. Żeby to sprawdzić użyłem ponownie wygenerowanych fal sinusoidalnych o tej samej częstotliwości, zgodnych w fazie oraz znajdujących się w przeciwfazie oraz wprowadziłem różnice w amplitudzie dla lewego i prawego kanału. W domyślnym widoku zawsze pokazywała się amplituda wyższa i nie była w żaden sposób uśredniona. Wygląda więc na to, że widok domyślny pluginu Oscarizor działa zgodnie z moimi potrzebami nakładając osobno analizowane wykresy lewego i prawego kanału w prosty sposób na siebie bez uśredniania. Używając go mogę zatem bez przeszkód skorzystać ze stereofonicznej pary bliskiej, mając możliwie kompletny dla niej podgląd widma. Podobnie mogę również zachować się w przypadku pary XY. Teoretycznie jej monofonizowanie nie powinno wywołać znacznych zniekształceń widma, jednak skoro jest taka możliwość to praktyczniej będzie tego nie robić i postąpić podobnie jak z parą AB – użyć do badań sampli stereofonicznych.
Podsumowując, moje początkowe założenia wyboru tylko jednego mikrofonu w celu uniknięcia fazowania okazały się niepotrzebne, ale dzięki tym rozważaniom i obserwacjom zdecydowanie wzrosła moja świadomość, w jaki sposób rozchodzą się fale akustyczne w fortepianie w bliskim ujęciu oraz jakie są dostępne opcje prezentacji wykresów w analizatorach widma sygnałów stereofonicznych. Instrument wirtualny NI Grandeur nie ma możliwości wyboru pary mikrofonowej, dlatego w jego wypadku za każdym razem mamy do czynienia z ustawieniami domyślnymi producenta. Obecność tego wirtualnego instrumentu w badaniu jest swego rodzaju dodatkowym punktem odniesienia – sprawdzianem, jak pewne właściwości instrumentów akustycznych są odwzorowywane w jednej z popularniejszych bibliotek brzmień fortepianu samplera Native Instruments Kontakt.
Kolejna decyzja jaką musiałem podjąć dotyczyła zakresu danych służących do porównania brzmienia fortepianów między sobą. Pierwsze ograniczenie, o którym już wspomniałem, dotyczyło dynamiki – zdecydowałem o skupieniu się na mezzoforte (ale tylko na wykresie multi-instrumentalnym). Dalej, przy analizie spektralnej pojawia się pytanie o czas, tzn. który moment obwiedni dźwięku będzie najlepszy do porównania brzmienia. Ma to być moment ataku czy stan ustalony? Punkt w czasie czy uśrednienie większego odcinka?
Z moich doświadczeń oraz rozmaitych eksperymentów, które nie raz zdarzało mi się robić np. ze studentami podczas zajęć, polegających na odtwarzaniu dźwięków różnych instrumentów pozbawionych ataku lub krótkiego sampla zawierającego wyłącznie atak, wynika, że dla określenia barwy obie fazy dźwięku – atak i podtrzymanie/stan ustalony (sustain) są niezbędne. W fortepianie stan ustalony w zasadzie bezpośrednio przechodzi w fazę powolnego wygaszania (release lub decay) – aż do całkowitego uspokojenia się strun (chyba, że klawisz zostanie wcześniej puszczony i tłumik ją “zgasi”). Fakt, że w rzeczywistości (z wyjątkiem najniższego rejestru) mamy do czynienia z uderzanym chórem 2-3 strun, powoduje powstawanie efektu LFO – modulacji niskoczęstotliwościowej zarówno tonu podstawowego, jak i wszystkich tonów harmonicznych. Ta modulacja w unisonie jest ściśle zależna od precyzji stroiciela, a ze względu na system równomiernie temperowany przy łączeniu głosów jest nieunikniona. Jeśli ograniczymy się tylko do jednego punktu na osi czasu, w którym zbadamy spektrum to modulacja ta może wpłynąć na uzyskany obraz widma. Oscarizor daje wprawdzie opcję uzyskania obrazu 3D widma z uwzględnionym przebiegiem czasowym w postaci tzw. waterfall – widać na nim wspomniane modulacje, jednak przy nakładaniu się kilku wykresów na siebie (np. dźwięków z różnych fortepianów), tego typu obraz staje się mało czytelny. Ma on także ograniczenia w widocznej osi czasu – pełne wybrzmienie pojedynczego dźwięku nie mieści się w oknie. Mimo że ustawienia pluginu pozwalają na śledzenie max. 30 sekund nagrania to w wypadku widoku typu waterfall 3D jest to jedynie ok. 5-6 sekund. Dlatego, o ile obraz ten nadaje się do analizy w czasie rzeczywistym, to przy publikacji wyników jest już niewystarczający. Zdecydowałem zatem, że najlepszym wyborem do porównania barwy fortepianów w zakresie stanu ustalonego (sustain) będzie widok 2D “zamrożonego” spektrum, ale uśrednionego w czasie – opcja FFT Average 20.0x, tj. ok. 6 sekund. Dzięki temu wpływ ewentualnego LFO amplitudy składowych harmonicznych, wynikającego z trudnych do uniknięcia minimalnych różnic w stroju poszczególnych strun chóru, został zminimalizowany. Przy 6 sekundowym uśrednieniu daje to “likwidację” LFO o częstotliwości do ok. 0,17 Hz. Okienko analizy FFT ustawiłem na 16384 sampli ze względu na większą dokładność – dla uśrednionego sygnału w czasie mogłem sobie na to pozwolić. Wybrałem funkcję okna typu Hanninga (Hanna), choć przy tak dużym oknie nie zauważyłem większych różnic między innymi funkcjami dla “przeciekania” widma. Moment “zamrożenia” (funkcja Freeze) wyznaczany był dla poszczególnych dźwięków doświadczalnie na podstawie ich obwiedni. Dla niższych częstotliwości mógł on nastąpić nieco później niż dla wysokich ze względu na nieco dłuższe dochodzenie do stanu ustalonego – ustabilizowania się drgania struny.
O tak szerokim uśrednianiu czasowym z pewnością nie mogło być mowy w przypadku badania spektrum w momencie ataku. W tym wypadku wyłączyłem funkcję uśredniania czasowego – FFT Average (1.0x) oraz zmniejszyłem wielkość okna do 4096 sampli. Była to wartość kompromisowa. Dokładność wskazania częstotliwości przez to zmalała, jednak dzięki temu uzyskałem większe maksima amplitud, szybszy czas reakcji i było to bardziej praktyczne do określenia, w którym fortepianie atak dźwięku jest np. jaśniejszy – bogatszy w wyższe pasma. Wskazanie konkretnych szczegółowych częstotliwości ma tu mniejsze znaczenie.
Takie analizy należałoby przygotować przy porównywaniu ataku i wybrzmienia fortepianów w różnych wariantach: bez żadnych modyfikatorów, z pedałem sustain, z pedałem una corda lub moderatorem tłumiącym. Chcąc uwzględnić różne perspektywy mielibyśmy ponadto dla każdego fortepianu próbki w podwójnej ilości – pochodzące z pary AB oraz XY. Jak widać ilość danych do opracowania urosła w lawinowym tempie, dlatego konieczne stało się ich zoptymalizowanie. Badanie każdego pojedynczego dźwięku z pewnością nie jest niezbędne do postawienia ogólnych wniosków dotyczących różnic brzmieniowych. Można w tym zakresie dokonać pewnych redukcji. Pierwszy filtr, jaki moglibyśmy nałożyć dotyczy określenia punktów wspólnych wszystkich badanych fortepianów. Badania porównawcze brzmienia tracą sens w wybranym zakresie, gdy część instrumentów np. nie posiada określonej części skali lub moderatora. Zostajemy w takim wypadku postawieni w sytuacji braku kompletu danych. Np. maksymalny możliwy do zbadania ambitus wyznacza ten instrument, który ma najmniejszą skalę – czyli w naszym wypadku Walter (skala F1 do c4). Jedynym “modyfikatorem” brzmienia wspólnym dla wszystkich instrumentów jest możliwość podniesienia tłumików – forte/sustain. Pleyel nie posiada moderatora tłumiącego, a Walter pedału/dźwigni una corda. Oczywiście pozostałe rejestry i moderatory możemy zbadać w ramach np. porównywania różnic brzmieniowych w dynamikach piano-mezzoforte-forte ograniczonych do jednego instrumentu lub w zestawieniach multi-instrumentalnych, ale niekompletnych. Naszym celem jest jednak optymalizacja, dlatego trzeba niestety dokonać częściowego tymczasowego odrzucenia tej części danych, a w razie pojawienia się wątpliwości lub chęci pogłębienia badań mogą zostać w każdej chwili przywrócone.
Wyznaczenie “punktów wspólnych” ograniczyło na ten moment ilość wykresów spektrum poszczególnych fortepianów nałożonych na siebie do 126 (63 wysokości dźwięków w wariancie standardowym i z podniesieniem wszystkich tłumików). Jeśli dodamy do tej liczby wykresy pojedyncze poszczególnych fortepianów i rozróżnienie pod względem pary mikrofonów (bliskie AB i średnie XY) to w dalszym ciągu liczba ta jest przytłaczająca, kilkaset wykresów. Postanowiłem w związku z tym sięgnąć do listy celów, jakie zostały wyznaczone przy powstawaniu projektu. Określając jakim zakresem danych jestem w stanie te cele osiągnąć będę w stanie odpowiednio zredukować ich ilość.
Pierwszym celem wymienionym w założeniach projektu ma być “pomiar właściwości ataku dźwięku na różnych poziomach dynamicznych”. Postanowiłem w tym celu zestawić wykresy próbek nagranych w piano – mezzoforte – forte poszczególnych fortepianów z osobna, skupiając się na ich transjentach początkowych oraz oglądając wykres porównawczy nałożonych na siebie spektrum fazy ataku wszystkich fortepianów. Ponieważ atak dźwięku najszczegółowiej jest reprezentowany na bliskiej parze AB, możemy ograniczyć się tylko do tego ujęcia. Nie ma jednak konieczności sprawdzania tych właściwości dla każdej wysokości dźwięku. Nie będą się one drastycznie zmieniały z każdym dźwiękiem. Jeżeli pojawią się jakieś zauważalne różnice to będą one związane z rejestrami lub specyficznymi cechami konstrukcyjnymi, np. tworzywem, którym wyścielony jest młotek, rodzajem struny czy klawisza (białe/czarne). Dlatego w znaczny sposób można ograniczyć ilość badanych wysokości dźwięków, aby zmierzyć ten aspekt, ale uwzględniając przy tym specyfikę danego instrumentu. Na pewno dużą pomocą mogą się okazać w tym wypadku stworzone z sampli instrumenty wirtualne, dzięki którym te specyficzne właściwości ataku będzie można określić najpierw słuchowo – m.in. zauważyć ewentualne przeskoki jakościowe między rejestrami, a następnie z pomocą jedynie wąskiego zakresu wybranych pojedynczych dźwięków określić ich szczegółowy charakter. Sporządzone wykresy dla wybranych dźwięków mają dwie postaci: 1. wykres typu waterfall pojedynczego fortepianu, na którym można zaobserwować m.in. to w jakim czasie poszczególne harmoniczne i nieharmoniczne wygasają przechodząc w fazę sustain oraz jak różnią się transjenty pod względem spektrum przy różnych poziomach dynamicznych; 2. zestawienie wykresów wszystkich badanych fortepianów w formie zamrożonego spektrum w chwili ataku, służące do porównania charakterów widmowych między sobą.
Drugim aspektem badań ma być “pomiar charakterystyki wybrzmiewania strun w zależności od rejestru i dynamiki”. Wykresami, które pomogą określić tę charakterystykę i ją porównać między instrumentami mogą być z pewnością uśrednione czasowo nakładające się wykresy multi-instrumentalne fazy sustain. Dla zweryfikowania wpływu odległości na charakterystykę wybrzmiewania utworzone zostały wykresy zarówno dla pary bliskiej mikrofonów AB, jak i pary XY, znajdującej się przed instrumentem. Ponieważ faza sustain w przypadku fortepianu mimo przytrzymania klawisza jest w rzeczywistości stopniowym wygaszaniem (dźwięk nie jest podtrzymywany np. przez pocieranie struny), postanowiłem, że dla dźwięków, które wygaszają się dłużej, czyli dla niskiego rejestru, będę badał widmo dwukrotnie – w trakcie “wczesnej” fazy sustain oraz “późnej”. Skoro interesują nas przede wszystkim rejestry, a nie pełna skala dźwięków to ponownie mamy tutaj możliwość redukcji danych. Najlepiej jednak, aby nie były to np. dźwięki odległe od siebie o oktawę, ponieważ w ten sposób możemy nie zauważyć specyficznej odpowiedzi rezonansowej płyty i pudła dostrojonej do któregoś stopnia skali. Najbardziej zauważalne są alikwoty dla rejestrów niskich, dlatego w tym obszarze należałoby nieco zwiększyć ilość dźwięków. Na bazie doświadczeń przy nagraniach i obserwacji z wykorzystaniem instrumentów wirtualnych mogę stwierdzić, że rezonanse te są najsilniejsze w oktawie wielkiej, co wynika z rozmiarów instrumentów. Z kolei w przypadku dźwięków najwyższych różnice będą najmniejsze i najtrudniejsze do wychwycenia. Trzeba tutaj zwrócić uwagę na szczegół konstrukcyjny – w rejestrach najwyższych fortepianów z mechanizmem angielskim nie ma tłumików. Uderzona struna będzie wybrzmiewać nawet po puszczeniu klawisza, a rezonanse sąsiadujących, nietłumionych strun będą to wybrzmienie zabarwiać. Ponownie sięgając do obserwacji i doświadczeń, mogę stwierdzić, że zabarwienie to jest praktycznie niezmienne i wynika bardziej z odpowiedzi na szerokopasmowy impuls ataku niż jest to wpływ struny uderzonej na sąsiadujące. W zupełności wystarczy więc opracowanie wykresu dla jednego dźwięku z najwyższej oktawy (najwyższy dźwięk w Walterze – o najmniejszej skali – to c4, więc jest to granica, której nie możemy przekroczyć, aby porównać wszystkie instrumenty). Przy wyborze dźwięków warto wziąć pod uwagę również rodzaj strun (mosiężne, w owijce, żelazne) i ich ilość w chórze. Różnice te we wszystkich fortepianach pojawiają się na obszarze pierwszych trzech oktaw. Dlatego, aby je zaobserwować warto byłoby przynajmniej jeden stopień skali powtarzać w kolejnych oktawach. Najbardziej pretenduje do tej roli dźwięk F ze względu na fakt, że jest to dźwięk najniższy w fortepianach Waltera i Marty’ego. Jeżeli chodzi o pomiar charakterystyki z uwzględnieniem dynamiki to we wcześniejszych optymalizacjach, mających na celu uzyskanie przejrzystości danych w typie wykresu multi-instrumentalnego, założyliśmy, że ograniczymy się do jednej dynamiki – mezzoforte. Tego założenia wolałbym nie zmieniać, dlatego kwestię różnic charakterystyki przy różnych dynamikach możemy sprawdzić na wykresach amplitudy i spektrum próbek piano-mezzoforte-forte poszczególnych fortepianów. W tym celu sporządzone zostały wykresy typu waterfall, podobne do tych służących do badania ataku, ale ze względu na ograniczenia analizatora (tylko ok. 4 sekundowe odcinki widoczne jednocześnie) zdecydowałem się na zapis w postaci wideo.
Przy badaniu “specyfiki rezonansu wybrzmienia pedałowego” należałoby porównać kształt widma fazy sustain bez użycia pedału oraz z jego użyciem. Tutaj również warto, podobnie jak w poprzednim aspekcie badania, dla dźwięków w dolnej połowie zrealizować oddzielne wykresy dla fazy wczesnej i późnej. W sposób szczególny będą się tutaj uwydatniały rezonanse strun – tych których tony podstawowe i najniższe harmoniczne będą pokrywały się z harmonicznymi uderzonego dźwięku. Będzie to najłatwiejsze do zaobserwowania zwłaszcza w niskim rejestrze, dlatego warto go w tej części badania potraktować nieco bardziej priorytetowo i szczegółowo, podobnie jak to miało miejsce przy określaniu charakterystyki wybrzmienia dźwięku podstawowego – bez uniesionych tłumików. Badane mogą być te same wysokości dźwięków. Podczas opisywania specyfiki rezonansu wybrzmienia pedałowego będziemy skupiać się głównie na określeniu, które alikwoty najmocniej się uwypuklają oraz jak bardzo to widmo zostaje wzbogacone. Warto porównać również w tym wypadku jak zachowują się dźwięki na tym samym stopniu skali w różnych oktawach – zwłaszcza pierwszych trzech. Poprzednim razem wyznaczyliśmy w tym kontekście dźwięk F, więc tutaj możemy to powtórzyć i skorzystać przy tym porównaniu z gotowych już wykresów. Najwyższy rejestr warto porównać w kontekście faktu, że nie posiada on tłumików. Można sprawdzić czy ton wysokiej struny jest na tyle mocny, że wzbudzi się coś w niższych strunach, czy raczej będą rezonowały te same struny co bez pedału – sąsiadujące, bez tłumików. Prawdopodobnie samo uderzenie w klawisz – stuk mechanizmu może wywołać “chmurę” odpowiedzi niższych rejestrów. Ponieważ chcielibyśmy porównać nie tylko jak zmienia się barwa po wciśnięciu pedału w danym fortepianie, ale też porównać fortepiany między sobą, utworzone zostały wykresy zestawieniowe w tej samej konfiguracji co wykresy sustainu fazy wczesnej i późnej. Dzięki temu można stawiając obok siebie wykresy dla tych samych dźwięków sprawdzić jak widmo ulega zmianie. Dla łatwiejszej percepcji tych zmian dla poszczególnych fortepianów zostały ponadto utworzone wykresy w formie wideo nałożonych na siebie spektrum z i bez użycia pedału/dźwigni podnoszących tłumiki.
Kolejnym aspektem badania jest określenie “charakterystyki barwowej rejestru una corda” oraz “specyfiki tłumienia dźwięku”. Rejestr una corda nie jest obecny we wszystkich instrumentach. Skupiłem się w jego wypadku na fortepianach Marty’ego i Pleyela. Aby zbadać ten aspekt możemy porównać kilka dźwięków wybranych z rejestrów, w którym una corda funkcjonuje (czyli z wyjątkiem najniższych, pojedynczych strun strun) z tymi samymi dźwiękami w brzmieniu podstawowym (na kompletnych chórach strun). Najczęściej używanym rejestrem przy grze una corda jest rejestr środkowy i wysoki, więc na nim powinniśmy się skupić. Ze względu na zasadę działania rejestru una corda, czyli uderzenie młotka w pojedynczą strunę, jednym z efektów widocznych na spektrum może być brak modulacji amplitudy spowodowanej tonem różnicowym wynikłym z trudnego do uniknięcia lekkiego odstrojenia strun w obrębie jednego chóru. Dla potrzeb wcześniejszego określenia charakterystyki wybrzmienia – fazy sustain, te modulacje zostały jednak zredukowane poprzez uśrednienie czasowe analizy FFT i duże okienko. Aby sprawdzić czy faktycznie używając pedału una corda nie będziemy już obserwowali modulacji LFO amplitudy posłużyłem się zestawieniem wykresów amplitudy. Natomiast za pomocą nałożonych na siebie zamrożonych wykresów spektrum dźwięku barwy podstawowej oraz barwy una corda w fazie sustain zweryfikujemy jak ograniczenie się do pojedynczej struny wpływa na kształt widma.
Odnośnie “specyfiki tłumienia dźwięku” możemy rozumieć ją na dwa sposoby: jako charakterystykę barwową moderatorów tłumiących – takich jak w fortepianach Waltera i Marty’ego oraz jako niuanse związane z akcją tłumików mechanizmów we wszystkich fortepianach. Brzmienie uzyskane za pomocą moderatorów może być porównane w ramach jednego fortepianu w podobny sposób jak una corda – poprzez nałożenie wykresów spektrum barwy podstawowej i z użyciem moderatora. Spośród badanych fortepianów tylko dwa mają tego rodzaju moderatory – Marty i Walter. W przypadku Marty’ego mamy do dyspozycji dwa stopnie tłumienia, dlatego nałożone zostały na siebie trzy wykresy spektrum. Próbki zostały zsynchronizowane, jednak amplituda nie była normalizowana, aby sprawdzić stopień tłumienia.
To drugie rozumienie “tłumienia” – jako działania mechanizmów (tłumików) zostało przeze mnie zaobserwowane i omówione podczas tworzenia instrumentów wirtualnych. Dźwięki krótkie, w dynamice forte – gdy struny są mocno rozedrgane – nie są tłumione w ten sam sposób przez tłumiki jak wtedy, gdy dynamika jest mniejsza – mezzoforte, piano lub gdy chwilę odczekamy na spadek obwiedni amplitudy po mocnym uderzeniu w klawisz. Tłumiki są zbyt lekkie by dźwięk został od razu stłumiony przy silnym rozedrganiu, więc pojawiają się rozmaite krótkie przydźwięki flażoletowe zależne od miejsca, w którym struna jest tłumiona. Jest to szczególnie zauważalne przy grubszych, niskich strunach. Natomiast w najwyższym rejestrze oczywiście taki efekt nie występuje ze względu na brak tłumików. Dźwięki krótkie w dynamice forte – z tym charakterystycznym stłumieniem – były jednym z rodzajów nagranych próbek – sampli wykorzystanych przy tworzeniu instrumentów wirtualnych. Dzięki nim udało się w instrumentach wirtualnych zasymulować tą właściwość. Te dotychczasowe spostrzeżenia mogą zostać ewentualnie uszczegółowione przez opracowanie kilku wykresów tego typu dźwięków w różnych rejestrach, zagranych na poszczególnych fortepianach (z wyjątkiem wirtualnego NI Grandeura). Ustawienia analizy widmowej powinny być podobne jak przy badaniu ataków.
Aby podsumować i uporządkować zapotrzebowanie sporządziłem poniższą tabelę.
Tabela 3. Zestawienie przygotowanych wykresów na potrzeby analizy porównawczej.
Cel badania |
Rodzaj wykresu |
Wybór dźwięków |
Ilość wykresów |
Sample |
1. Pomiar właściwości ataku dźwięku na różnych poziomach dynamicznych |
1A. Wykresy spektrum (typ waterfall, nieuśredniony czasowo, okienko 4096, 4-sekundowy początkowy odcinek dźwięku) dla każdego fortepianu osobno, porównujący próbki w dynamice piano, mezzoforte i forte (obserwacja ataku), ujęcia mikrofonowe bliskiej pary AB |
F1, H, gis, a1, fis2, dis3 |
30 |
90 |
1B. Wykres porównawczy spektrum fazy ataku (zamrożony wycinek, analiza nieuśredniona czasowo, okienko 4096) wszystkich fortepianów, dynamika mezzoforte, ujęcia mikrofonowe bliskiej pary AB |
C, f1, h2 |
3 |
15 |
|
2. Pomiar charakterystyki wybrzmiewania strun w zależności od rejestru i dynamiki |
2A. Uśrednione czasowo (FFT AVG 20x, okienko 16384 sampli), zestawienie wykresów “zamrożonego” widma wczesnej fazy sustain w dynamice mezzoforte (sample znormalizowane, wyrównane czasowo względem ataku) wszystkich fortepianów, ujęcia mikrofonowe AB i XY (z wyj. NI Grandeur) |
F1, C, Cis, D, E, F, Fis, G, H, f, g1, ais2, e3, c4 |
28 |
126 |
2B. Uśrednione czasowo (FFT AVG 20x, okienko 16384 sampli), zestawienie wykresów “zamrożonego” widma późnej fazy sustain w dynamice mezzoforte (sample znormalizowane, wyrównane czasowo względem ataku) wszystkich fortepianów, ujęcia mikrofonowe AB i XY (z wyj. NI Grandeur) |
F1, C, E, H, g1 |
10 |
te same co w 2A |
|
2C. Wykresy spektrum w formie wideo (typ waterfall, bez uśrednienia czasowego, okienko 4096) dla każdego fortepianu osobno, całej długości trwania dźwięku, porównanie próbek w dynamice piano – mezzoforte i forte (obserwacja fazy sustain). Ujęcie bliskiej pary AB, video |
F1, H, gis, a1, fis2, dis3 |
30 |
te same co w 1A |
|
3. Badanie specyfiki rezonansu wybrzmienia pedałowego |
3A. Uśrednione czasowo (FFT AVG 20x, okienko 16384 sampli), zestawienie wykresów widma wczesnej fazy sustain w dynamice mezzoforte (znormalizowane, wyrównane czasowo względem ataku) z uniesieniem tłumików (pedał forte/dźwignia kolanowa) wszystkich fortepianów porównywane z wybranymi wykresami fazy sustain brzmienia podstawowego mezzoforte 2A, ujęcia mikrofonowe AB i XY (z wyj. NI Grandeur) |
F1, Cis, E, F, f, g1, ais2, e3, c4 |
18 |
81 |
3B. Uśrednione czasowo (FFT AVG 20x, okienko 16384 sampli), zestawienie wykresów widma późnej fazy sustain w dynamice mezzoforte (znormalizowane, wyrównane czasowo względem ataku) z uniesieniem tłumików (pedał forte/dźwignia kolanowa) wszystkich fortepianów porównywane z wybranymi wykresami fazy sustain brzmienia podstawowego mezzoforte 2B, ujęcia mikrofonowe AB i XY (z wyj. NI Grandeur) |
F1, E, g1 |
6 |
te same co w 3A |
|
3C. Nałożenie na siebie wykresów widma (FFT AVG 1x, okienko 8192 sampli) barwy podstawowej mezzoforte i po zastosowaniu pedału/dźwigni podnoszących tłumiki, amplituda wyrównana względem tonu podstawowego, wyrównane fazowo względem ataku, ujęcia bliskie AB, osobno dla wszystkich fortepianów, video |
F1, g1, c4 |
15 |
te same co w 2A i 3A |
|
4. Pomiar charakterystyki barwowej rejestru una corda |
4A. Nałożenie na siebie wykresów widma wczesnej fazy sustain barwy podstawowej mezzoforte i z pedałem una corda, wyrównane amplitudowo względem tonu podstawowego oraz czasowo względem ataku, bez uśrednienia czasowego, okienko 4096, osobno fortepiany Marty i Pleyel, ujęcia bliskie AB |
Pleyel: c, g1, c2, c3 Marty: c, a, c2, fis3 |
8 |
16 |
5. Pomiar charakterystyki barwowej moderatorów tłumiących |
5A. Nałożenie na siebie wykresów widma wczesnej fazy sustain barwy podstawowej forte i po zastosowaniu moderatora tłumiącego, bez równania amplitudy (sample nagrane jeden po drugim z możliwie identyczną siłą wciśnięcia klawisza – sprawdzenie stopnia tłumienia), wyrównane fazowo względem ataku, bez uśrednienia czasowego, okienko 4096, fortepiany Walter i Marty (dwa warianty tłumienia), zbliżenie na interesujący zakres pasma, ujęcia bliskie AB |
C, g , c2, g3 |
8 |
20 |
6. Specyfika tłumienia mechanizmów |
6A. Wykresy widma (FFT AVG 1x, okienko 8192) i amplitudy dźwięków krótkich w dyn. mezzoforte/forte wszystkich fortepianów z wyjątkiem NI Grandeura, ujęcie bliskie AB, widmo zamrożone po puszczeniu klawisza, video |
A1, G, fis, c2, d3, c4 |
24 |
24 |
Dzięki tej optymalizacji danych udało się ograniczyć ilość wszystkich wykresów wystarczających do osiągnięcia celów badawczych do 180. Ilość koniecznych do przygotowania (wyodrębnienia spośród nagranych) sampli stereofonicznych (AB i XY) wyniosła 372. Jak widać na powyższej tabeli ujęcia mikrofonowe XY postanowiłem wykorzystać jedynie przy określaniu widm uśrednionych czasowo dla fazy sustain (wczesnej i późnej) w brzmieniu podstawowym i z pedałem forte.