15 січня 2025, 14:19

Ідентифікація по голосу та мовленню. Фонетична експертиза

Семен Ханін
Семен Ханін «АМБЕР» керуючий партнер, адвокат, к.е.н., заслужений юрист України, член правління ААУ


Маєте Телеграм? Два кліки - і ви не пропустите жодної важливої юридичної новини. Нічого зайвого, лише #самасуть. З турботою про ваш час!


Мета цієї статті зблизити між собою математику та юриспруденцію. Зазвичай такі статті, які написані простою мовою, дратують професійних математиків, експертів та юристів. Але ця стаття саме для них, щоб вони побачили як телевізором заколочують цвяха. Тому прошу вибачення перед спеціалістами за спрощення, та до справи.

Що юрист знає про теорію ймовірностей. Юрист знає про частотну теорію, яка каже, що якщо дуже довго підкидувати монету у гору, то кількість разів, коли випаде орел, та випаде решка буде практично однакова. І юрист знає, що можливо казати про ймовірність 50% випадіння орла. І для цієї статті ми не будемо розширювати ці знання.

Але, окрім частотного підходу, є ще Баєсова інтерпретація ймовірності, коли ймовірність відображає ступінь довіри до події

Програмні комплекси, що працюють при ідентифікації по голосу та мовленню, працюють з Баєсовою інтерпретацією ймовірності, тобто дещо з іншою вірогідністю, незрозумілою та незвичною для юристів. 

Хай у нас є мішок з шарами — червоними та білими. Але нам не відомо як про кількість шарів, так і про співвідношення червоних та білих шарів. Ми виймаємо шар з мішка, записуємо його колір, та кладемо назад. Робимо висновок стосовно співвідношення білих та червоних шарів. Далі знов витягаємо шар! Але вже ми змінюємо свою гіпотезу з урахуванням попереднього результату. І так, поки не втомимося. Тобто ми змінюємо свою гіпотезу кожний раз з урахуванням попередніх досліджень, з кожним вимірюванням роблячи гіпотезу кращою. Між іншим, результат такого дослідження математики називають умовною вірогідністю.  

Изображение выглядит как линия, ГрафикАвтоматически созданное описаниеМаленьке зауваження. Ймовірність кожного разу витягнути червоний чи білий шар не залежить від попередніх спроб. Якщо, наприклад, червоних шарів — 40, а білих 60, то ймовірність кожний раз витягнути червоний шар — 40%. Але ми ж не знаємо як шари розфарбовані. І кожного разу, витягуючи шар, ми змінюємо свою гіпотезу про кількість червоних та білих шарів з урахування результату експерименту та попередніх результатів випробувань, відповідно змінюється умовна ймовірність. Але відображає вона дещо інше. На нашому прикладі, можливо уявити графік у вигляді ДЗВОНУ, де вершина дзвону — буде максимальною ймовірністю події, що червоних шарів 40%, а сторони дзвону, що йдуть до низу, ймовірність іншого співвідношення. 

Про неочевидні речі

Тут не треба зрозуміти, а треба лише відпочити. Або як виграти справу про наркотики. 

Кожний тест на наркотики неідеальний. 

У тесту є така властивість як чутливість, що означає ймовірність того, що людина, яка насправді приймає наркотики буде виявлена тестом. Хай така чутливість — 97%.

У тесту є така властивість як специфічність, що означає, ймовірність того, що людина, яка не приймає наркотики буде відображена тестом як така що не приймає наркотики. Хай така специфічність — 95%.

(Звертаю вашу увагу, що наслідками тесту може бути не 2, а 4 результати: 

  • Людина приймає наркотики, та тест її виявив; 

  • Людина приймає наркотики, та тест це не виявив; 

  • Людина не приймає наркотики, але тест помилився, та показав що приймає; 

  • Людина не приймає наркотики, та тест це підтвердив). 

Ще дуже важливий показник, це показник раніше проведених досліджень (як з шарами). Наприклад, ми перевірили усю країну, та встановили, що 0.5% громадян приймають наркотики. Тобто, якщо б ми випадковим чином вибрали людину з усіх громадян країни, то з ймовірністю 0.5% вона наркоман. 

Тоді, оцінюючи результати тесту, який дав відповідь про наркозалежність людини, ми повинні застосувати нові знання про умовну ймовірність, яка розраховується так:

0.97 x 0.005 / (0.97 x 0.005 + (1-0.95)x(1-0.005))=0.09, 

тобто справжня можливість бути наркоманом з позитивним результатом цього тесту становить лише 9%, а не 97% — як зазвичай у судовому засіданні псевдоексперт та детектив скажуть судді! Ось що таке Баєсова інтерпретація ймовірності, та її відмінність від частотної теорії. 

Про фонетичну експертизу

Пошукайте у Google стосовно програмного комплексу Sive Base. Там побачите наступне:

«Програмний комплекс для ідентифікації людини по голосу та мовленню SIVE Base використовується для визначення та порівняння параметрів голосу мовця об`єктивним способом з метою відображення статистичного розподілу відповідних параметрів на діаграмах і розрахування коефіцієнту кореляції між цими діаграмами….SIVE VOICE — програмний комплекс для автоматичного пошуку досліджуваного голосу в заданому наборі файлів, що містять зразки голосів, на основі Баєсовської оцінки».

Ой, як цікаво!!!!! 

Наскільки важливі результати попередніх досліджень для Баєсовської оцінки ми вже зрозуміли на прикладі тесту на наркотики. Тут така сама справа. Програмний комплекс навчають, та потім перевіряють це навчання, на певній групі осіб. Непотрібно бути лінгвістом, щоб зрозуміти наскільки ця група є визначальною. Хто ці люди, які навчали модель? Вони були англомовні? Вони були російськомовні? Вони розмовляли українською, але це не була їх рідна мова? Як ці люди відрізнялися за віком та статтю? Скільки було осіб у згаданій групі? Без відповіді на ці питання використання певного програмного комплексу є лише шарлатанством.

А це ще далеко не усі запитання. А як було записано експериментальний та контрольний зразки, однією технікою чи різною? Частота дискретизації? Розмір глибини бітів?

Тобто, що відбулося. Простою мовою.

За допомогою перетворення Фур'є запис з голосом та мовленням Особи розкладають на прості гармоніки по частотам. (Це як у школі біле світло завдяки призмі розкладають на спектр).  

Далі за допомогою, наприклад, ві́дстані Кульбака — Лейблера на основі тестової групи осіб навчають певну модель ідентифікувати Осіб по голосу та мовленню. (За допомогою лінійки вимріють різницю у рості між людьми, та відбирають максимально схожих за ростом).

І це насправді наука — математика. 

Потім йде певне шарлатанство на етапі створення програмного комплексу, а саме шарлатанство полягає у відсутності відповідей на раніше зазначені питання. Крім того, насправді є ще дуже велика кількість запитань: технічні характеристики запису та їхній вплив на чутливість та специфічність методу та інше. Все це добре розуміється математиками, але сумлінно приховується експертами, що використовують такі програмні комплекси. Та за допомогою цієї АБВГДейки вирішується доля людей та працює наше правосуддя.

 

0
0

Додати коментар

Відмінити Опублікувати