22 січня 2021, 11:41

Як дослідити фірму з 60 млн документів

Уявіть, що вам доведеться шукати всі документи, електронні листи та повідомлення величезної транснаціональної компанії. Це знайомо судовому бухгалтеру Юср Халіл, яка була частиною команди, що мала знайти докази протиправних дій аерокосмічного гіганта — компанії Airbus після того, як фірма визнала плату хабарів через посередників, повідомляє веб-сайт BBC.


Маєте Телеграм? Два кліки - і ви не пропустите жодної важливої юридичної новини. Нічого зайвого, лише #самасуть. З турботою про ваш час!


Читайте також: "Політику розвитку штучного інтелекту в Польщі прийнято. Що далі?".

"Airbus був схожий на вежу з 900 квартирами в ній. Ми повинні були вирішити, в які з них збираємось піти і досліджувати докази", — каже Юср Халіл.

Пані Халіл працює у FRA — судово-слідчому бізнесі, який підтримує юридичні справи по всьому світу. Але це був окремий випадок і найбільша робота FRA за всю історію. Пані Халіл та її команда зіткнулися з цілим "океаном" файлів, даних про транзакції та електронних листів, що охоплюють всесвітню діяльність фірми. То як вони змогли дослідити та вивчити усі документи?

Штучний інтелект (ШІ) та спеціальний комп’ютер, на відміну від звичайного ПК, зіграли велику роль у обробці цієї маси даних. Потрібно було зменшити "колекцію" з 500 млн документів та транзакцій. Оскільки обсяги даних постійно зростають, ШІ використовується у таких дослідженнях найчастіше. Після усунення штучним інтелектом дублікатів та інших невідповідних матеріалів слідчим було залишено 60 млн документів для ознайомлення. ШІ шукав у них шаблони та помічав невідповідні фрагменти, наприклад, спонсорську угоду на $100 млн.

800 співробітників Airbus по всьому світу були законно призначені зберігачами цих документів. "Вони могли мати інформацію, розповсюджену на різних носіях, таких як ноутбуки, пристрої зберігання даних, USB-накопичувачі тощо. Нам довелося визначити, хто був кінцевим зберігачем цих даних", — розповідає партнер-засновник та співголова з аналізу даних у FRA Грег Мейсон. Було створено 7 безпечних місць розслідування. Це дозволило перевіряти документи в повній безпеці, що є ключовим моментом для Airbus. Адже це величезний бізнес, переплетений з основними європейськими військовими проєктами, тож слідству довелося розробити спосіб уникнути матеріалів, які є "національно делікатними".

Спеціалізоване програмне забезпечення дозволяло збирати інформацію, не бачачи цілого документа, з якого вона надійшла, тим самим зберігаючи таємну інформацію від сторонніх очей. Крім того, на замовлення було використано комп’ютери, на яких працювали декілька дисків та не було підключення до інтернету. Це називається «повітряним розривом», що забезпечував певний розділ між конфіденційними даними та зовнішнім світом інтернету. FRA витягнув метадані, інформацію, яка лежить в основі кожного електронного документа, що визначає його суть, і використав їх для індексації матеріалів, щоб недоречні файли могли бути видалені.

ШІ ліг в основу технологічного аналізу або огляду за допомогою технологій (TAR) — це процес надання комп'ютерному програмному забезпеченню електронної класифікації документів на основі даних експертів-рецензентів з метою пришвидшити організацію та визначити пріоритетність збору документів. ШІ був навчений пошуку неструктурованих даних, таких як електронні листи. Їх важко сканувати, на відміну від структурованих даних, що містяться у формах та стовпцях. Використовуючи принцип машинного навчання, згідно з яким програмне забезпечення ШІ бачить кілька прикладів певного типу повідомлень і починає визначати, до якої категорії вони належать, FRA змогла швидко витягувати відповідні документи. "Програма ШІ шукала контекст повідомлень, а контекст — це все", — зазначає пан Мейсон.

Програмне забезпечення шукало хабарі, які оформляли за кодами, наприклад, лікар виписував ліки. Запускаючи приклади такого роду прихованих повідомлень, програмне забезпечення набуло концепції медицини, а потім концепції рецепта. Це означало, що він може пробиратися через неструктуровані дані та виявляти корупційні практики. "Коли ви тільки виявляєте все більше і більше прикладів негласних платежів, ШІ дізнається про це на льоту. У цьому полягає краса і магія ШІ", — говорить пан Мейсон. Він вважає, що лише близько 5% відкладених документів були перевірені людьми. "ШІ не є панацеєю, але це надзвичайно, як він навчається і працює". Він вражений тим, як швидко технологія ШІ робить великі обсяги роботи: "Навіть невелика справа сьогодні має величезний обсяг даних". Йому довелося продати нову концепцію TAR таким регуляторним органам, як офіс серйозних шахрайств Великобританії (SFO), та отримати схвалення щодо застосування концепції, яка не була традиційним підходом до розслідування. "Це було найскладніше розслідування, яке я коли-небудь влаштовував".

І хоча 4-річне розслідування звучить виснажливо, розкриття цієї справи з помічником ШІ принесло команді багато особистого задоволення. І їх праця отримала юридичне схвалення. Вікторія Шарп, одна з найвищих суддів цивільних судів Англії та Уельсу, підсумувала далекосяжний вплив цього розслідування з визначною роллю ШІ.

0
0

Додати коментар

Відмінити Опублікувати