Hotline: 0975.176.376 - 0975.73.75.77

VIETTEL AI GIÀNH GIẢI NHẤT 2 LẦN LIÊN TIẾP VỀ NHẬN DẠNG TIẾNG NÓI

Cuộc thi thuộc khuôn khổ Hội thảo Quốc tế lần thứ 9 về Xử lý ngôn ngữ và Tiếng nói tiếng Việt do câu lạc bộ VLSP, chi hội của Hội Tin học Việt Nam tổ chức.

Viettel AI giành giải nhất 2 lần liên tiếp về nhận dạng tiếng nói

07/12/2022

Cuộc thi thuộc khuôn khổ Hội thảo Quốc tế lần thứ 9 về Xử lý ngôn ngữ và Tiếng nói tiếng Việt do câu lạc bộ VLSP, chi hội của Hội Tin học Việt Nam tổ chức.

Là hội thảo được tổ chức thường niên trong lĩnh vực Xử lý ngôn ngữ và Tiếng nói tiếng Việt, VLSP 2022 là nơi quy tụ các nhà nghiên cứu, chuyên gia và đơn vị phát triển công nghệ hàng đầu.

Nhận dạng tiếng nói (Automatic Speech Recognition) là một trong những bài toán quan trọng của Xử lý tiếng nói nhằm chuyển đổi tín hiệu tiếng nói đầu vào thành văn bản tương ứng. Các đội thi được yêu cầu nhận dạng các bài giảng trực tuyến nhằm đáp ứng nhu cầu tự động phân loại, đánh chỉ mục, tìm kiếm nội dung bài giảng,… từ kho dữ liệu.

Viettel AI tiếp cận vấn đề theo hướng tận dụng hiệu quả nguồn dữ liệu thô không nhãn thay vì chỉ tập trung vào dữ liệu gán nhãn như thông thường.

Theo đó, giải pháp của Viettel AI, hệ sinh thái sản phẩm AI do Trung tâm Không gian mạng Viettel phát triển, đã ứng dụng một số cải tiến quan trọng như phương pháp che tín hiệu tiếng nói ở cả miền thời gian và miền tần số hay thay thế mô hình Transformer bằng mô hình Conformer tiên tiến hơn,…

Những cải tiến này đã giúp Viettel AI giải quyết hiệu quả cả 2 bộ dữ liệu tại hạng mục Nhận dạng tiếng nói với tỷ lệ chính xác lên đến 92,03%, trong khi độ chính xác của các nhóm còn lại là từ 67,24 - 89,79%.

Viettel AI lần thứ 2 liên tiếp chiến thắng tại hạng mục Nhận dạng tiếng nói, cuộc thi VLSP (Ảnh: Viettel AI).

Đây là năm thứ 3 và là năm thứ 2 liên tiếp Viettel AI chiến thắng tại cuộc thi VLSP. Bên cạnh 2 giải nhất tại hạng mục Nhận dạng tiếng nói, Viettel AI cũng đạt giải Nhì tại hạng mục Tổng hợp tiếng nói có cảm xúc (Emotional Speech Synthesis).

Tiên phong phát triển và ứng dụng công nghệ hàng đầu về Xử lý tiếng nói, các sản phẩm thuộc hệ sinh thái trí tuệ nhân tạo Viettel AI như trợ lý ảo, tổng đài ảo,… có thể tương tác hơn 2.600 kịch bản hội thoại với độ chính xác hơn 96%, giọng nói truyền cảm, độ tự nhiên đạt 95% giọng người thật.

Hiện nay, các sản phẩm này đã được ứng dụng rộng rãi tại nhiều doanh nghiệp, cơ quan ban ngành ở các tỉnh thành trên toàn quốc. Đại diện Viettel AI cho biết, đơn vị sẽ tiếp tục phát triển, nâng cấp liên tục sản phẩm để tăng mức độ chính xác, khả năng hiểu ý định người dùng và hiệu suất làm việc.

Trong những năm gần đây, hội thảo VLSP tập trung tổ chức các cuộc thi về xử lý ngôn ngữ, nhằm thúc đẩy phát triển nghiên cứu cũng như tạo ra các bộ dữ liệu chung chia sẻ cho cộng đồng nghiên cứu VLSP.

Năm 2022, cuộc thi thu hút đông đảo các đội dự thi đến từ các trường đại học nổi tiếng trong và ngoài nước như Đại học Stanford - Mỹ, Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST), cũng như các đội đến từ các doanh nghiệp công nghệ lớn như Viettel, Vin Group, FPT.