Chuyển văn bản thành bài phát biểu trên Linux với Festival
- Thể LoạI: Linux
Có nhiều lý do khiến bạn muốn bật tính năng chuyển văn bản thành giọng nói trên máy tính. Bạn có thể bị thị lực kém (hoặc không), bạn có thể cần tính năng này cho một thí nghiệm khoa học hoặc có thể bạn chỉ muốn đọc các tệp nhật ký của mình. Bất kể lý do là gì, chuyển văn bản thành giọng nói trong Linux là một nhiệm vụ khá đơn giản.
Cũng có nhiều hệ thống con có thể được sử dụng cho mục đích này. Nhưng trong bài viết này, tôi muốn giải quyết bằng cách sử dụng hệ thống Festival để cho phép nhận dạng văn bản thành giọng nói. Khi tính năng này hoạt động, bạn có thể sử dụng nó theo cách nào bạn cần và theo nhiều cách bạn cần.
lễ hội
Hệ thống chuyển văn bản thành giọng nói của Lễ hội được tạo ra bởi Alan W. Black tại Trung tâm Nghiên cứu Công nghệ Giọng nói tại Đại học Edinburgh (với sự đóng góp của Đại học Carnegie Melon). Festival là một hệ thống chuyển văn bản thành giọng nói đầy đủ với nhiều API và một môi trường đầy đủ để nghiên cứu và phát triển trong lĩnh vực tổng hợp giọng nói.
Festival đã được thiết kế như một hệ thống đa ngôn ngữ bao gồm tiếng Anh (cách phát âm của Anh và Mỹ), tiếng Wales và tiếng Tây Ban Nha. Đối với các ngôn ngữ khác (chẳng hạn như tiếng Tây Ban Nha, tiếng Séc, tiếng Phần Lan, tiếng Hindi, tiếng Ý, tiếng Marathi, tiếng Ba Lan, tiếng Nga và tiếng Telugu) phải được cài đặt để sử dụng.
Cài đặt
Nhiều bản phân phối đã bao gồm Festival theo mặc định. Nhưng trong trường hợp của bạn không, bạn có thể cài đặt nó bằng các bước đơn giản sau:
Mở cửa sổ dòng lệnh.
- Su cho người dùng root (hoặc sử dụng sudo nếu cần).
- Ra lệnh lễ hội cài đặt yum (thay thế yum với trình cài đặt gói cụ thể của bạn, chẳng hạn như apt-get ).
- Chấp nhận bất kỳ phụ thuộc nào.
Đó là nó! Lễ hội hiện đã có trên hệ thống của bạn và sẵn sàng hoạt động. Hãy kiểm tra nó.
Thử nghiệm.
Đương nhiên, bạn sẽ cần phải có một hệ thống âm thanh hoạt động trên PC để sử dụng Festival. Hãy chắc chắn rằng Festival đang hoạt động. Mở lại cửa sổ dòng lệnh và ra lệnh:
echo 'Bạn có muốn chơi trò chơi không?' | lễ hội --tts
LƯU Ý: Hy vọng rằng bạn biết những gì trích dẫn trên là từ. ;-)
Nếu bạn nghe thấy Liên hoan giọng nói tổng hợp đang hoạt động. Bây giờ hãy đọc Festival từ một tệp văn bản. Tạo một tệp văn bản với một số nội dung và lưu tệp dưới dạng test.txt . Bây giờ, trở lại cửa sổ terminal, hãy ra lệnh:
lễ hội --tts test.txt
Bạn sẽ nghe thấy giọng nói tổng hợp đọc lại văn bản của bạn cho bạn.
Với Festival hoạt động bình thường, bạn cũng có thể đọc các tệp PDF với sự trợ giúp của trình đọc Adobe. Với trình đọc Adobe được cài đặt, bạn có thể mở một tệp PDF và sau đó nhấp vào Xem> Đọc to để bật văn bản thành giọng nói trên tài liệu. Với hệ thống này, bạn có thể tạm dừng, đọc toàn bộ tài liệu, chỉ đọc một trang và hơn thế nữa.
Suy nghĩ cuối cùng
Bạn thực sự có thể vui chơi với hệ thống Lễ hội. Bạn có thể thiết lập báo thức (sử dụng tại lệnh) để đánh thức bạn bằng đồng hồ báo thức tổng hợp đặc biệt và hơn thế nữa. Nhưng chuyển văn bản thành giọng nói không chỉ để giải trí hoặc nghiên cứu. Hãy nhớ rằng, có một thế giới người dùng máy tính dựa vào các hệ thống như thế này. May mắn thay, cộng đồng Linux đã đáp ứng nhu cầu này.