Добро пожаловать в гости Фусанг!
Текущее местоположение:Первая страница >> Наука и техника

Китайский институт языковой разведки АСЕАН независимо создает многоязычное корпус

2025-09-19 08:47:50 Наука и техника

Китайский институт языковой разведки АСЕАН независимо создает многоязычное корпус

В последние годы, благодаря быстрому развитию технологий искусственного интеллекта и обработки естественного языка, строительство многоязычного корпуса стало важной основой для продвижения межязычного общения и технологических инноваций. Научно -исследовательский институт АССЕАН АСЕАН (далее именуемый «Институт») недавно объявил, что он успешно создал многоязычный корпус, охватывающий основные языки десяти стран АСЕАН, направленного на то, чтобы способствовать взаимодействии языка, культурного распространения и интеллектуального технологического сотрудничества между Китаем и странами АСЕАН.

Конструкция этого корпуса не только заполняет пробел в области многоязычных языковых ресурсов в Китае, но также обеспечивает высококачественную поддержку данных для приложений искусственного интеллекта, таких как машинный перевод, распознавание речи и анализ текста. Вот обзор основных функций и данных этого корпуса:

Китайский институт языковой разведки АСЕАН независимо создает многоязычное корпус

Языковые типыКорпусная шкала (100 миллионов слов)Зоны покрытияИсточник данных
китайский50Новости, право, наука и литератураГосударственные публикации, правительственные документы
Тайский12Социальные сети, новости, путешествияПредоставлено сетевыми ползами и кооперативными учреждениями
вьетнамский10Экономика, культуры, образованиеАкадемические документы, средства массовой информации
малайский8Бизнес, право, ежедневные разговорыКорпоративное сотрудничество, агентство переводов
индонезийский8Новости, социальные сети, кино и телевидениеОбщественные наборы данных, ползание сети

Корпусные сценарии

Строительство этого корпуса обеспечивает базовую поддержку приложений в нескольких областях, в основном, включая:

1Машинный перевод: Благодаря высокоязычному многоязычному параллельному корпусу, институт обучил модель перевода, которая поддерживает языковые пары, такие как китайско-английский, китайский Тайланд и Китай-Вьетнам, и точность перевода значительно улучшается.

2Распознавание голоса: Голосовые данные в корпусе предоставляют учебные материалы для систем распознавания речи в странах АСЕАН, помогая разрабатывать такие приложения, как интеллектуальные голосовые помощники и системы обслуживания клиентов.

3Посещение информации о перекрестном языке: Пользователи могут искать связанный контент на языках АСЕАН через китайские ключевые слова, которые значительно облегчают академические исследования и коммерческую информацию.

4Культурное общение и исследования: Литература, кино и телевизионный контент в корпусе предоставляет культурным ученым богатые аналитические материалы и способствуют культурным обменам между странами Китая и АСЕАН.

Будущее планирование

Институт сказал, что в будущем масштаб и языковые типы корпуса будут расширены в будущем, и планируют включить больше небольших языков АСЕАН, таких как бирманский и камбоджийский. В то же время институт будет сотрудничать с академическими учреждениями и предприятиями в странах АСЕАН, чтобы способствовать открытому совместному использованию корпуса и внести свой вклад в исследование глобальных языковых разведки.

Строительство этого многоязычного корпуса является не только важным достижением Китайского института языковой разведки в Китае, но также обеспечивает сильную поддержку взаимодействия языка и технического сотрудничества в рамках инициативы «Пояс и дорога». Благодаря постоянному развитию технологий искусственного интеллекта, перспективы применения многоязычного корпуса будут шире.

Следующая статья
Рекомендуемые статьи
Чтение рейтинга
Дружелюбные ссылки
Разделительная линия