VTCC giành giải nhất 2 lần liên tiếp về nhận dạng tiếng nói

Khánh Hòa (TT Không gian mạng Viettel) đã đăng lúc 09:51 - 02.12.2022

VTCC lần thứ 2 liên tiếp giành giải nhất tại hạng mục Nhận dạng tiếng nói, cuộc thi VLSP 2022 - Vietnamese Language and Speech Processing.

Cuộc thi thuộc khuôn khổ Hội thảo Quốc tế lần thứ 9 về Xử lý ngôn ngữ và Tiếng nói tiếng Việt do câu lạc bộ VLSP, chi hội của Hội Tin học Việt Nam tổ chức. Là hội thảo được tổ chức thường niên trong lĩnh vực Xử lý ngôn ngữ và Tiếng nói tiếng Việt, VLSP 2022 là nơi quy tụ các nhà nghiên cứu, chuyên gia và đơn vị phát triển công nghệ hàng đầu.

Nhận dạng tiếng nói (Automatic Speech Recognition) là một trong những bài toán quan trọng của Xử lý tiếng nói nhằm chuyển đổi tín hiệu tiếng nói đầu vào thành văn bản tương ứng. Các đội thi được yêu cầu nhận dạng các bài giảng trực tuyến nhằm đáp ứng nhu cầu tự động phân loại, đánh chỉ mục, tìm kiếm nội dung bài giảng,… từ kho dữ liệu.

VTCC tiếp cận vấn đề theo hướng tận dụng hiệu quả nguồn dữ liệu thô không nhãn thay vì chỉ tập trung vào dữ liệu gán nhãn như thông thường.

Theo đó, giải pháp của VTCC, hệ sinh thái sản phẩm AI do Trung tâm Không gian mạng Viettel phát triển, đã ứng dụng một số cải tiến quan trọng như phương pháp che tín hiệu tiếng nói ở cả miền thời gian và miền tần số hay thay thế mô hình Transformer bằng mô hình Conformer tiên tiến hơn,…

Những cải tiến này đã giúp VTCC giải quyết hiệu quả cả 2 bộ dữ liệu tại hạng mục Nhận dạng tiếng nói với tỷ lệ chính xác lên đến 92,03%, trong khi độ chính xác của các nhóm còn lại là từ 67,24 - 89,79%.

317411498_539378041363050_6548561098975899001_n
Viettel AI lần thứ 2 liên tiếp chiến thắng tại hạng mục Nhận dạng tiếng nói, cuộc thi VLSP. 

Đây là năm thứ 3 và là năm thứ 2 liên tiếp VTCC chiến thắng tại cuộc thi VLSP. Bên cạnh 2 giải nhất tại hạng mục Nhận dạng tiếng nói, VTCC cũng đạt giải Nhì tại hạng mục Tổng hợp tiếng nói có cảm xúc (Emotional Speech Synthesis).

Tiên phong phát triển và ứng dụng công nghệ hàng đầu về Xử lý tiếng nói, các sản phẩm thuộc hệ sinh thái trí tuệ nhân tạo VTCC như trợ lý ảo, tổng đài ảo,… có thể tương tác hơn 2.600 kịch bản hội thoại với độ chính xác hơn 96%, giọng nói truyền cảm, độ tự nhiên đạt 95% giọng người thật.

Hiện nay, các sản phẩm này đã được ứng dụng rộng rãi tại nhiều doanh nghiệp, cơ quan ban ngành ở các tỉnh thành trên toàn quốc. Đại diện VTCC cho biết, đơn vị sẽ tiếp tục phát triển, nâng cấp liên tục sản phẩm để tăng mức độ chính xác, khả năng hiểu ý định người dùng và hiệu suất làm việc.

Trong những năm gần đây, hội thảo VLSP tập trung tổ chức các cuộc thi về xử lý ngôn ngữ, nhằm thúc đẩy phát triển nghiên cứu cũng như tạo ra các bộ dữ liệu chung chia sẻ cho cộng đồng nghiên cứu VLSP.

Năm 2022, cuộc thi thu hút đông đảo các đội dự thi đến từ các trường đại học nổi tiếng trong và ngoài nước như Đại học Stanford - Mỹ, Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST), cũng như các đội đến từ các doanh nghiệp công nghệ lớn như Viettel, Vin Group, FPT.

VTIT tham dự triển lãm CNTT lớn nhất Nhật Bản

  • 1

Người Viettel chung sức đồng lòng, cam kết bứt phá trong Quý II

  • 9

Viettel đưa công nghệ số đến vùng đất lịch sử Điện Biên

Viettel nghiên cứu đầu tư trung tâm logistic tại Nam Ninh, Trung Quốc

CBNV vui lòng đăng nhập để đọc nhiều nội dung hơn
Bỏ qua