02 ноября 2018, 11:13
Гарвард оцифровал судебный архив для обучения нейросетей
Школа права Гарвардского университета открыла доступ ко всем судебным делам с 1600-х годов и до наших дней, сообщило издание Fortune. Архив будут использовать для обучения искусственного интеллекта и разработки средств автоматизации в юридической практике.
Школа права Гарвардского университета запустила проект по оцифровке судебных дел под названием Caselaw Access в 2013 году. За это время сотрудники Лаборатории библиотечных инноваций оцифровали более 40 миллионов страниц дел судебных разбирательств, проведенных в США с 1600-х годов и до наших дней.
Реклама
Теперь архив судебных дел открыт для всех. Новые дела будут оцифровываться автоматически и база юридической практики будет постоянно пополняться и обновляться. Главное предназначение оцифрованных данных — создание «идеального» датасета и помощь в машинном обучении.
В полностью открытом доступе сейчас находятся общие данные о почти семи миллионах судебных разбирательств. Скачивать для использования можно не более 500 документов в день. Ограничение будет актуально до 2024 года, после этого данные можно будет скачивать без ограничений по количеству.
Актуальная база судебной практики позволит разработчикам систем искусственного интеллекта быстро и юридически грамотно обучать нейросети пониманию законов, алгоритмам принятия судебных решений и правильному ведению процессов в уголовных и гражданских делах.
На сайте проекта Caselaw Access открыта не только база судебного архива, но и есть бесплатные инструменты для разработчиков. С помощью выложенных API можно создавать собственные решения с использованием базы юридической практики — в том числе чат-боты или поисковые системы.
Реклама
Реклама