Гарвард оцифровал судебный архив для обучения нейросетей | 360°

02 ноября 2018, 11:13

Гарвард оцифровал судебный архив для обучения нейросетей

Читать 360 в

Школа права Гарвардского университета открыла доступ ко всем судебным делам с 1600-х годов и до наших дней, сообщило издание Fortune. Архив будут использовать для обучения искусственного интеллекта и разработки средств автоматизации в юридической практике.

Школа права Гарвардского университета запустила проект по оцифровке судебных дел под названием Caselaw Access в 2013 году. За это время сотрудники Лаборатории библиотечных инноваций оцифровали более 40 миллионов страниц дел судебных разбирательств, проведенных в США с 1600-х годов и до наших дней.

Реклама

Теперь архив судебных дел открыт для всех. Новые дела будут оцифровываться автоматически и база юридической практики будет постоянно пополняться и обновляться. Главное предназначение оцифрованных данных — создание «идеального» датасета и помощь в машинном обучении.

В полностью открытом доступе сейчас находятся общие данные о почти семи миллионах судебных разбирательств. Скачивать для использования можно не более 500 документов в день. Ограничение будет актуально до 2024 года, после этого данные можно будет скачивать без ограничений по количеству.

Актуальная база судебной практики позволит разработчикам систем искусственного интеллекта быстро и юридически грамотно обучать нейросети пониманию законов, алгоритмам принятия судебных решений и правильному ведению процессов в уголовных и гражданских делах.

На сайте проекта Caselaw Access открыта не только база судебного архива, но и есть бесплатные инструменты для разработчиков. С помощью выложенных API можно создавать собственные решения с использованием базы юридической практики — в том числе чат-боты или поисковые системы.

Реклама

Реклама