Phát triển mô hình Speech-to-Text với khả năng nhận diện và chuyển đổi giọng nói thành văn bản một cách chính xác cho cả tiếng Anh và tiếng Việt với dấu câu chính xác. Đồng thời xây dựng một giải pháp cho xử lý giọng nói thời gian thực (realtime).

GitHub - AI4LI-Language/speech-to-text: (Almost) Realtime speech-to-text for the visually impaired.