W porządku. Jak możesz to przygotuj ostateczną wersję wymogów widzianych waszymi oczami dotyczącą tego tematu. Tak by ułatwiło i uprzyjemniło wam prace.
Postaralem sie cos napisac w wolnym czasie, nie wiem na ile to jest kompletne. Staralem sie uwzgledniac i analizowac propozycje innych uzytkownikow, ale w wiekszosci to jest tak jak ja to widze. Nie wiem, czy pisze zrozumiale.
...::: NORMY DOTYCZĄCE DŹWIĘKÓW - PROPOZYCJA ROBOCZA, DO DYSKUSJI:::...
JAKOŚĆ DŹWIĘKU
1. Jakość docelowa
a) Rozdzielczość bitowa.
Przy obecnych standardach najistotniejsze jest moim zdaniem podniesienie rozdzielczości do co najmniej 16 bitów, plus obsługa przez symulator wyższych rozdzielczości.
b) Częstotliwość próbkowania
Standardowa częstotliwość próbkowania powinna zostać podniesiona do co najmniej 32000Hz, co wynika z obserwacji, że ludzkie ucho jest mało czułe na częstotliwości powyżej 16kHz; tę samą obserwację wykorzystano w formacie mp3. Nic nie stoi na przeszkodzie aby używać wyższych częstotliwości próbkowania, zwłaszcza dla dźwięków modulowanych, takich jak runningnoise, lub niższych, jeśli po uważnej analizie spektrogramu stwierdzi się, że dźwięk rzeczywiście nie wymaga wyższej częstotliwości próbkowania.
c) Głośność dźwięku
Proponuję standaryzację głośności dźwięku na takim poziomie, by po przeskanowaniu ReplayGain, np. w programie foobar2000 uzyskać wartość -5dB. W przypadku trzyczęściowych dźwięków typu start-środek-stop wystarczy przeskanować środkowy dźwięk. Nie jestem pewny, czy algorytm ReplayGain sprawdzi się w przypadku dźwięków zawierających dużo ciszy, np. rozmowy przez radiotelefon.
d) Dźwięki wewnętrzne, zewnętrzne i stereofonia plików dźwiękowych, czyli pobożne życzenia cz. I
Po przeanalizowaniu uwag użytkowników mk1991, macius5991 i Lorem dochodzę do wniosku, że warto pokusić się o rozdzielenie dźwięków na wewnętrzne, nagrane w kabinie i zewnętrzne, nagrane z zewnątrz, podlegające efektowi dopplera, można nawet pokusić się o osobny zestaw do przedziału maszynowego. Nie widzę zastosowania dla dźwięków nagranych w stereo, czyli dwoma mikrofonami jednocześnie, gdyż użytkownik ma swobodę rozglądania się i chodzenia po kabinie, co w rzeczywistości wpływało by na zmiany w odbiorze przestrzennym dźwięku.
e) Dźwięki zapętlane
Od twórców dźwięków powinno wymagać się, aby dźwięki, które odtwarzane są w pętli (np. silniki, syreny, dźwięki otoczenia), nie przejawiały objawów zapętlenia, to jest klików, stuków, przerw, strzelania, szarpnięć itp. Skopiowanie i odwrócenie w czasie tak, by dźwięk odtwarzał się naprzemiennie tak jak został nagrany i od końca niekoniecznie jest dobrym pomysłem, gdyż nie zapobiega powstawaniu klików lub stuków. Powtarzanie tego samego fragmentu kilkukronie w jednym pliku dźwiękowym jest zdecydowanie złym pomysłem.
W przypadku trzyczęściowych dźwięków typu start-środek-stop ważne jest by zadbać o brak klików w momentach przejściowych, czyli między częściami start-środek, start-stop oraz środek-środek. Nie ma kontroli nad tym, kiedy użytkownik wyłączy urządzenie, lub puści klawisz sygnału dźwiękowego, co spowodować może klik, wobec czego przejście środek-stop nie jest tak istotne.
2. Jakość źródłowa
a) Sprzęt nagrywający
Warto zadbać by sprzęt, krórym nagrywa się dźwięk, gwarantował dobrą jakość dźwięku. Najlepiej powinny się sprawdzać dedykowane do tego urządzenia, np. dyktafony cyfrowe. Z moich doświadczeń z aparatami cyfrowymi wynika, że często nie gwarantują one wystarczającej jakości dźwięku poprzez niewystarczającą częstotliwość próbkowania, stratną kompresję dźwięku, wbudowany układ automatycznej regulacji głośności (ang. automatic gain control) powodujący zniekształcenia dynamiki nagrania itp. Więcej o kompresji stratnej w podpunkcie c).
W przypadku nagrywania urządzeń typu skaner nasłuchowy wystarczy komputer z kartą dźwiękową z wejściem liniowym.
b) Częstotliwość próbkowania
Częstotliwość próbkowania nagrania źródłowego, z którego tworzy się potem dźwięki powinna wynosić co najmniej 32000Hz, rekomendowane jest co najmniej 44100Hz w przypadku dźwięków niemodulowanych i 48000Hz w przypadku dźwięków modulowanych. Obowiązuje zasada im więcej tym lepiej, oczywiście w granicach rozsądku i możliwości sprzętu nagrywającego.
c) Rozdzielczość bitowa i kompresja stratna
Rozdzielczość bitowa nagrania źródłowego powinna wynosić co najmniej 16 bitów w przypadku zapisu bezstratnego. W przypadku stratnej kompresji warto zadbać o to, by nie było słychać charakterystycznego szelestu, dzwonienia, czy jakkolwiek nazwiemy słyszalne efekty stratnej kompresji. Jeśli twórca widzi w spektrogramie "dziury" poniżej 10kHz nie powinien wykorzystywać takiego źródła do tworzenia dźwięku.
Odtwarzacze mp3 wyposażone w funkcję nagrywania często stosują stratną metodę kompresji, ADPCM, która różni się brzmieniem od kompresji mp3, aac, ogg itp. Wprowadza ona zniekształcenia harmoniczne w postaci szumu lub trzeszczenia. Autor dźwięku powinien ocenić, czy zniekształcenia te są na tyle poważne, że wykluczają tworzenie dźwięku z takiego źródła.
Odradza się zamieszczanie materiałów filmowych na dźwięki w serwisach typu YouTube, gdyż kompresują one stratnie przesłany materiał, co w najgorszym przypadku skutkuje stratnym kompresowaniem już skompresowanego stratnie materiału pogorszającym dalej jego jakość. W zamian proponuję upload wydzielonego z pliku wideo dźwięku na serwer eu.
Niedopuszczalne jest przy obecnych standardach nagranie dźwięku w rozdzielczości 8 bitów, a po stwierdzeniu, że jest za cicho, dalsze jego zgłaśnianie. Efektem są np. rozmowy przez radiotelefon w scenariuszu Całkowo SN61, których realna rozdzielczość wynosi mniej więcej 3 bity.
d) Przesterowanie
Za wszelką cenę należy unikać przesterowania w materiale źródłowym. Jeżeli jest to możliwe, należy zmniejszyć głośność nagrywania. Jeśli urządzenie nie pozwala na zmianę głośności, lub zmiana głośności odbywa się po konwersji sygnału z analogowego na cyfrowy, nie nadaje się ono do nagrywania tak głośnych dźwięków.
3. Częstotliwość próbkowania w symulatorze, czyli pobożne życzenia cz. II
Użytkownik powinien mieć możliwość wyboru, tak jak w wielu programach i grach, częstotliwości próbkowania, do której odbywać będzie się miksowanie, np. z listy 22050Hz, 32000Hz, 44100Hz, 48000Hz, 96000Hz. Dla zachowania jak najlepszej jakości potrzebne będzie zastosowanie algorytmu interpolacji niewprowadzającego zniekształceń harmonicznych.
DŹWIĘK W SYMULATORZE
1. Głośność odtwarzania, czyli pobożne życzenia cz. III
a) Parametr głośności
W plikach mmd oraz w definicji dźwięku w scenerii powinien być parametr odpowiadający za głośność odtwarzania danego dźwięku w skali linearnej, tzn. 1 – głośność jak w pliku, 0.5 – głośność 2 razy mniejsza, 2 – głośność 2 razy większa itd.
b) Głośność symulatora
Warto zadbać, by odtworzenie kilku dźwięków jednocześnie nie powodowało przesterowania.
2. Dialogi, zapowiedzi stacyjne i podpisy
Autor dźwięku zawierającego dialogi przez radiotelefon, zapowiedzi stacyjne itd. powinien dostarczyć razem z nim plik z podpisami wg standardu z tego postu:
http://eu07.pl/forum/index.php/topic,19326.msg369001.html#msg369001DŹWIĘKI OTOCZENIA, CZYLI PROPOZYCJA DLA TWÓRCÓW SCENERII
Użytkownik mk1991 proponuje powszechne stosowanie dźwięków otoczenia w sceneriach. Można nagrać i zapetlic np. ruchliwa ulice, rozmowy pasazerow na peronie, brzmienie lasu itp, poustawiać w odpowiednich miejscach scenerii, ustalić z jakiej odległości mają być słyszalne i włączać i wyłączać je eventami.