28.10.2020

Использование Искусственного Интеллекта и больших данных (Big Data) для создания инструментов работы в судах.

Оригинал здесь.
Автор: Alan Carlson.
В последнее время значительное внимание сфокусировано на разработке инструментов, которые должны помочь людям ориентироваться в судебном процессе, разрешать правовые споры и принимать правовые решения. Использование ИИ для анализа подходящих наборов данных может существенно улучшить эффективность и удобство этих инструментов. В то же время, есть серьезные риски и недостатки в случаях, когда разработка и использование таких инструментов происходит ненадлежащим образом.
Существует три подхода к построению компьютерных систем принятия решений. Первый подход – построение экспертной системы. Он начинается с четкой артикуляции всех правил и логики принятия решений, которые наш инструмент должен использовать при выработке решений. Даже в умеренно сложных системах, не говоря уже о правовой системе, выявление и составление таких правил и логики принятия решений может быть неподъемной задачей. Хотя, если правила и логика принятия решений ясны, внутренняя работа нашего инструмента прозрачна для любого, кто проверяет код с целью разобраться как получился тот или иной результат.
Второй подход – анализ с целью “выучить правила” путем наблюдений, выявить шаблон для распознавания, и создать инструмент, который производит предсказания на основе закономерностей, выявленных в обучающем наборе данных.
Третий подход состоит в “изучении” опыта, или от анализа информации, загруженной в систему, или от генерации многочисленных сценариев на основе фундаментальных правил и выявлении успешных стратегий выработки предсказаний. Этот подход называется “обучение без сопровождения”. Неясно, какие правила могут быть использованы в системе принятия правовых решений, но возможно удастся улучшить предсказательную способность нашего инструмента путем постоянного анализа новых данных.
Когда есть понимание того, что инструмент должен выполнять / предсказывать, собирается набор данных, аналогичных тем, к которым инструмент будет применен. Идентификация соответствующи данных, сбор данных, их очистка и преобразование (так называемая разработка функций) часто занимает больше времени, чем построение самой модели. Небольшая часть исходного набора данных отводится в качестве «тестового набора данных» для оценки модели после ее построения. Большая часть данных используется в качестве «набора данных для обучения».
Один или несколько подходов ИИ применяются к набору данных для построения модели. Обычно требуется много итераций для поиска подхода к обучающему набору данных, пока модель не достигнет приемлемого уровня точности в прогнозировании. Как только модель разработана, она применяется к тестовому набору данных для дальнейшей оценки точности прогнозирования. Если модель не достигает приемлемой производительности в тестовом наборе данных, необходимы дополнительные итерации или другие модификации модели. Обратите внимание, что не следует ожидать, что разработанная модель будет на 100% точной в своих прогнозах. Большинство методов искусственного интеллекта используют статистику для генерации моделей, и поэтому прогнозы являются статистически более вероятными. Более того, инструмент, который достаточно точен в прогнозировании набора обучающих данных, может не достичь такого же уровня точности при применении к тестовому набору данных или новым сценариям.
Как только модель обеспечивает удовлетворительную производительность, ее можно развернуть и применить к новым сценариям. При некоторых подходах ИИ модель не модифицируется новыми данными на постоянной основе. Модель может периодически пересматриваться, чтобы увидеть, является ли она все еще приемлемо точной, и может пересматриваться с использованием новых данных, но обновление не является «автоматическим». При других подходах к искусственному интеллекту новые данные используются моделью для постоянного улучшения ее производительности.
ИИ не знает всего – он знает только то, что находится в наборе обучающих данных, использованном для его построения. Если какая-то нужная информация отсутствует в наборе обучающих данных, она не может стать частью прогнозов инструмента ИИ. И наоборот, если в набор обучающих данных включены данные, которые не связаны или не имеют отношения к искомым прогнозам, инструмент может находить шаблоны в этих нерелевантных данных и использовать эти шаблоны для принятия решений, которые не имеют смысла для искомого прогнозирования.
Подходы ИИ, использующие контролируемое обучение, включают анализ обучающего набора данных, содержащего информацию о прошлых событиях и решениях того же или аналогичного типа, что и те, к которым будет применяться инструмент. Например, инструмент, вырабатывающий предварительное решение о судебном деле, построен на основе обучающего набора данных о предыдущих решениях. Поскольку обучающий набор данных содержит только прошлые решения, инструмент обязательно будет генерировать прогнозы в соответствии с прошлыми решениями. Более того, подходы ИИ предназначены для создания инструмента, который оптимизирует существующие практики, содержащиеся в наборе данных обучения. В то время как ИИ идентифицирует существующие модели и практики, возможно, находя те, о которых люди, возможно, не знали, ИИ не может открывать новые способы ведения дел, импровизировать или предлагать другие инновационные практики или результаты, которых нет в существующих практиках.
Ответственное создание и использование инструмента требует, чтобы сценарии, к которым должен применяться инструмент, были практически схожи со сценариями в наборе обучающих данных. Подходы ИИ не могут предвидеть или изменяться в ответ на изменения в сценариях, к которым он применяется, если только он не будет постоянно обновляться данными о новых сценариях. Если инструмент применяется к новым сценариям, отсутствующим в наборе обучающих данных, не следует ожидать полезных прогнозов.
Механизм, используемый в обучении ИИ, состоит в том, чтобы перемещаться по набору учебных данных в поисках шаблонов. В настоящее время нет возможности включить в анализ контекст конкретных данных или то, что является базовыми принципами, которые создали комбинацию данных, которые анализируются. Для анализа ИИ количество точек данных более важно, чем связи или отношения между точками данных. Из того, что модель использует определенные данные для прогнозирования, необязательно следует, что данные и прогноз строго связаны – статистическая корреляция не подразумевает причинно-следственную связь. Шаблоны, используемые для прогнозирования, могут быть просто случайными или могут существовать в наборе учебных данных, но не в «реальном мире».
Инструменты с ИИ решают проблемы не так, как люди. При решении проблемы и вынесении рекомендаций человеческий разум может применять многие типы мышления и другие инструменты: дедукция, индукция, символическое мышление, пространственная логика, эмоциональный интеллект, кратковременная память, долговременная память, эвристика и т. д. Кроме того, люди полагаются на коллективное обучение других людей – «коллективный разум» . Хотя существует множество подходов ИИ к проблемам, лежащие в основе процессы не так разнообразны.
Текущее состояние дел таково, что зачастую вообще невозможно объяснить, как или почему ИИ достиг именно этого результата. Это в большей степени относится к некоторым методам искусственного интеллекта, например, глубокому обучению с подкреплением. Это также верно, когда ИИ построен с использованием обучающего набора данных, который содержит большое количество переменных данных для каждого примера. При большом количестве входных данных может быть неочевидно, сколько факторов и которые из них были наиболее важными или относились к прогнозу, сделанному в отношении конкретного сценария.
Ну и наконец, важно понимать насколько разная степень доверия людей к предсказаниям компьютера. Значительная группа людей не удовлетворена прогнозом, предлагаемым любым компьютерным алгоритмом, не говоря уже об ИИ. Некоторые в этой группе будут доверять или принимать решение, принятое человеком, который, по их мнению, обладает достаточным образованием и опытом, чтобы принимать такие решения, а не доверять алгоритму. Другие будут полагаться на свое собственное мнение, а не на алгоритмы или экспертов. Некоторые не будут доверять инструменту, если он не включает в себя факторы, которые человек считает актуальными. Другая группа людей не доверяет или больше не доверяет лицам, принимающим решения, в частности экспертам, и может в большей степени доверять решению, предлагаемому инструментом, разработанным ИИ. Следовательно, веб-порталы и юридические инструменты принятия решений, разработанные с использованием ИИ, должны создаваться и использоваться таким образом, чтобы распознавать и пытаться учесть все эти перспективы.

ПРИМЕРЫ ИСПОЛЬЗОВАНИЯ ИИ В СУДЕБНОЙ СИСТЕМЕ.
– Он-лайн поиск юридической информации. Методы поиска на естественном языке используются для определения того, какой закон (дела, уставы, нормативные акты, научный анализ, практические руководства и т. д.) может быть применим к конкретному юридическому вопросу. Инструменты текстового поиска были «отрегулированы» для использования фраз и информации о цитировании, а также основных словосочетаний. Эти методы упоминаются как обработка естественного языка (Natural Language Processing, NLP).
– Автоматизация рутинных задач. Извлечение данных из судебных документов: а) для обеспечения ввода данных в электронную систему регистрации или систему управления делами, б) заполнение форм, в) принятие мер на основе извлеченных данных, например, идентификация документов или данных в качестве конфиденциального или подлежащего закрытию, или d) решение об отслеживании дел, основанное на характере и сложности дела. Эта техника называется Robotic Process Automation (RPA).
– Сборка документов. Генерация юридических документов из автоматизированных шаблонов с использованием данных в системе управления делами или с использованием ответов на интервью в стиле вопросника. Этот подход в настоящее время широко используется для оказания помощи лицам, которые представляют себя в суде сами.
– Инструменты для досудебного освобождения, которые помогают судьям принять решение об освобождении подсудимого, который был арестован в ожидании суда. Несколько юрисдикций также используют инструменты оценки риска для вынесения приговора. Идут жаркие споры об использовании этих инструментов.
– Разрешение споров в режиме онлайн. Используются несколько инструментов, которые помогают людям в разрешении споров в режиме онлайн, без «обращения в суд». Некоторые очень специфичны для предмета, например, для ссылок на трафик, другие более универсальны. Многие из них сосредоточены на мелких, но объемистых судебных делах, таких как дела арендодателя / выселения или мелкие иски.
– Проверка юридических документов. Одним из примеров является рассмотрение предлагаемого предписания в случае семейного права. ИИ может оценить: а) соответствие предлагаемого приказа применимому законодательству, б) полноту и в) соответствие общепринятым практикам, например, механизмам опеки над детьми. Это также может помечать потенциально несправедливые приказы или дисбаланс положений, основанный на асимметрии влияния между сторонами в судебном процессе.
– Установление подлинной личности арестованного или участника слушания. Во время ареста необходимо установить личность человека для определения прошлой преступной деятельности, статуса условно-досрочного освобождения или условно-досрочного освобождения или выдачи ордеров на арест, если таковые имеются. В настоящее время первоначальная идентификация обычно выполняется с помощью отпечатков пальцев, что требует времени для обработки через локальную, штатную или федеральную базу данных отпечатков пальцев. Кроме того, каждый раз, когда ответчик предстает перед судом, необходимо удостовериться, что ответчик действительно является ответчиком. Это особенно важно для слушания приговора. Из-за затраченного времени дактилоскопия проводится не каждый раз. Вероятно, идентификация может быть более быстрой и точной с использованием методов распознавания лиц, которые могут быть выполнены в начале каждого слушания.
– Изготовление стенограммы непосредственно из слушания или его записи. Инструмент может использовать преобразование речи в текст для создания письменной расшифровки устных показаний, данных на слушании, или устного распоряжения судей после слушания.

РИСКИ ИСПОЛЬЗОВАНИЯ ИИ.
– Предвзятость при составлении обучающего набора данных;
– Пробелы или ограничения в обучающем наборе данных;
– Необъяснимый аспект или «черный ящик» ИИ;
– Ограниченные или плохо определенные цели или неправильное применение ИИ;
– Неопределенная ответственность за использование ИИ;
– Обман или взлом ИИ;
– Утрата конфиденциальности пользователей.
По каждому из этих рисков нужно выявлять их источники и искать способы их устранения или снижения.
Также следует помнить, что многие из этих рисков присущи и людям.

Один комментарий к “Использование Искусственного Интеллекта и больших данных (Big Data) для создания инструментов работы в судах.

  1. Верная мысль. Мало просто загрузить ИИ информацией – нужно ещё правильным способом подать ему нужную информацию, а над этим предстоит ещё работать и работать. И помнить: робот не умеет ничего, кроме того, чему его научил человек. Впрочем, с перечисленными в статье задачами он способен справляться уже сейчас, путь и пока далеко не в совершенстве.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *