Vài năm trở lại đây, chúng ta đã quen với công nghệ chuyển đổi lời nói thành văn bản nhờ các trợ lý ảo của Amazon hay Google. Nhưng giờ đây, nhân loại đã có thêm một cột mốc ấn tượng nữa trong lịch sử phát triển với công nghệ chuyển đổi ý nghĩ thành văn bản.
Trong quá trình giải mã điện tâm đồ bệnh động kinh, một nhóm nghiên cứu thuộc phòng thí nghiệm của bác sĩ Edward Chang, Đại học California San Francisco (UCSF) đã tìm cách ghi lại tín hiệu phát ra từ vỏ não bệnh nhân.
Các bác sĩ yêu cầu người bệnh đọc và lặp lại một số câu nói cho sẵn, đồng thời dùng các điện cực ghi lại tín hiệu cùng hoạt động của não tại thời điểm đó.
Tín hiệu từ vỏ não của bệnh nhân được ghi lại bằng các xung điện. (Ảnh: mc.ai).
Từ dữ liệu thu thập được, nhóm này phân tích các tín hiệu của não tương ứng với tín hiệu giọng nói nhất định: nguyên âm, phụ âm, chuyển động miệng…
Sau đó họ dùng một hệ thống thần kinh nhân tạo khác để giải mã ngược các tín hiệu này thành văn bản. Kho dữ liệu của thí nghiệm chỉ bao gồm khoảng 30-50 câu nói. Hệ thống sẽ cố gắng dự đoán và sắp xếp văn bản dựa trên tín hiệu của vỏ não.
Ở điều kiện tốt nhất, hệ thống chuyển đổi này chỉ sai sót khoảng 3%. Xét trong điều kiện thí nghiệm, đây gần như là việc đọc suy nghĩ của người khác. Tuy nhiên, nhóm nghiên cứu cũng chỉ ra rằng những dự đoán không chính xác của hệ thống khác với với việc sai lệch mà chúng ta nghe nhầm bởi tai người.
Ví dụ: “The museum hires musicians every evening” (Bảo tàng thuê nhạc công vào mỗi tối) bị dự đoán thành “The museum hires musicians every expensive morning” (Bảo tàng thuê nhạc công vào mỗi sáng đắt đỏ).
Hoặc “Part of the cake was eaten by the dog” (Một phần chiếc bánh đã bị chó ăn) bị dự đoán thành “Part of the cake was the cookie” (Một phần chiếc bánh làm từ bánh quy).
Trí tuệ nhân tạo AI có thể nhận biết tín hiệu giọng nói từ não và chuyển thành văn bản. (Ảnh: Andrew Ostrovsky/Getty Images).
Trong các trường hợp sai sót nhiều nhất, các lỗi ở văn bản đầu ra hầu như không liên quan về mặt ngữ nghĩa hay ngữ âm so với lời nói gốc.
Mặc dù vẫn còn nhiều hạn chế, nhưng hệ thống này có tiềm năng phát triển hướng đi mới cho việc giải mã hoạt động não dựa trên trí tuệ nhân tạo AI để diễn tả lời nói của con người (với mức sai sót 5%).
Tất nhiên sự so sánh này chưa thực sự công bằng. Con người chuyển tải lời nói bằng việc dùng tới hàng chục nghìn từ vựng. Ngược lại, hệ thống này chỉ phải học tín hiệu của khoảng 250 từ vựng với một tập hợp câu ngắn và hạn chế.
Nhóm nghiên cứu cho rằng trong tương lai, hệ thống sẽ đóng vai trò quan trọng trong việc hỗ trợ những bệnh nhân mất khả năng trò chuyện.
Tác giả bài viết: Vinathis.com
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Vinathis Network ra đời nhằm mục đích trở thành cầu nối giữa các doanh nghiệp và khách hàng, cung cấp những thông tin giá trị về thị trường, sản phẩm, và các xu hướng quản trị hiện đại. Chúng tôi mong muốn hỗ trợ doanh nghiệp trong việc quảng bá thương hiệu, sản phẩm và dịch vụ của mình đến với đối...