• 02 ноября 2018, 11:13

    Гарвард оцифровал судебный архив для обучения нейросетей

    Школа права Гарвардского университета открыла доступ ко всем судебным делам с 1600-х годов и до наших дней, сообщило издание Fortune. Архив будут использовать для обучения искусственного интеллекта и разработки средств автоматизации в юридической практике.
    Гарвард оцифровал судебный архив для обучения нейросетей

    Школа права Гарвардского университета запустила проект по оцифровке судебных дел под названием Caselaw Access в 2013 году. За это время сотрудники Лаборатории библиотечных инноваций оцифровали более 40 миллионов страниц дел судебных разбирательств, проведенных в США с 1600-х годов и до наших дней.

    Теперь архив судебных дел открыт для всех. Новые дела будут оцифровываться автоматически и база юридической практики будет постоянно пополняться и обновляться. Главное предназначение оцифрованных данных — создание «идеального» датасета и помощь в машинном обучении.

    В полностью открытом доступе сейчас находятся общие данные о почти семи миллионах судебных разбирательств. Скачивать для использования можно не более 500 документов в день. Ограничение будет актуально до 2024 года, после этого данные можно будет скачивать без ограничений по количеству.

    Актуальная база судебной практики позволит разработчикам систем искусственного интеллекта быстро и юридически грамотно обучать нейросети пониманию законов, алгоритмам принятия судебных решений и правильному ведению процессов в уголовных и гражданских делах.

    На сайте проекта Caselaw Access открыта не только база судебного архива, но и есть бесплатные инструменты для разработчиков. С помощью выложенных API можно создавать собственные решения с использованием базы юридической практики — в том числе чат-боты или поисковые системы.