Friday, November 4, 2016

Adobe đang phát triển ứng dụng chỉnh sửa audio, tạo thêm câu, từ mới vào đoạn ghi âm có sẵn

Adobe đang phát triển một công chỉnh sửa âm thanh tương tự Photoshop, cho phép người dùng có thể bổ sung thêm từ ngữ, câu nói vào trong một đoạn audio có sẵn. Dựa trên phân tích đoạn thu âm giọng nói, phần mềm sẽ có thể sao chép đặc tính giọng nói và từ đó "gắn" thêm những câu nói mới vào trong một đoạn audio cho trước với chất giọng, âm điệu,.... hài hòa với bản gốc. Nói cách khác, bạn có thể thêm những nội dung, câu từ vào file ghi âm mà người nói chưa bao giờ nói ra.

Tại hội nghị Adobe MAX tổ chức ở San Diego, Zeyu Jin, một lập trình viên của Adobe, cho biết dự án phát triển công có tên là Project VoCo và hiện vẫn chưa rõ khi nào thì nó mới được thương mại hóa chính thức. Dự án được Adobe hợp tác cùng với các nhà nghiên cứu tại Đại học Princeton.

Project_voco_Tinhte_1.jpg
Ảnh chụp slide trình chiếu giới thiệu công cụ Voco tại sự kiện ở San Diego

Hiện tại vẫn chưa có nhiều thông tin chi tiết về công cụ này, tuy nhiên có thể hình dung nó là một công cụ chỉnh sửa audio chuyên dụng, tương tự như dùng Photoshop để sửa ảnh. Bên cạnh khả năng tinh chỉnh giọng nói và giảm tiếng ồn, Project VoCo còn có thể tự tạo ra những từ ngữ mới dựa vào những gì mà người nói ghi âm lại. Về cơ bản, qua phân tích dữ liệu giọng nói thu được, phần mềm sẽ hiểu được đặc điểm của giọng bói và sao chép, từ đó tạo nên những thông tin mới.

Tại sự kiện Jin đã biểu diễn thử tính năng của Project VoCo, cho phép ông thêm những từ mới vào đoạn audio có sẵn với độ phù hợp gần như hoàn hảo. Ông cho biết là tất cả những gì phần mềm cần là một đoạn thu âm 20 phút và sau đó, nó có thể sao chép giọng nói.

Project_voco_Tinhte_2.jpg
Chỉ cần gõ từ vào, hệ thống sẽ thêm vào trong đoạn ghi âm

Trong thông cáo phát đi, Adobe cho biết: "Khi ghi âm giọng nói, đoạn hội thoại hoặc bài thuyết trình, người ta thường muốn thay đổi hoặc chèn thêm những từ hoặc vài từ mới do khi nói bị mắc lỗi hoặc đơn giản là bởi gì họ muốn thay đổi nội dung một phần của đoạn ghi âm. Chúng tôi đã phát triển một công nghệ gọi là Project VoCo để bạn có thể đơn giản là gõ từ hoặc câu mà bạn muốn thay đổi và chèn vào giọng nói."

Và nếu như hồi xưa Photoshop đã tạo nên cuộc cách mạng trong việc chỉnh sửa và sáng tạo hình ảnh thì biết đâu, công cụ Project VoCo lần này của Adobe cũng làm được điều tương tự đối với âm thanh, cho phép người ta chỉnh sửa nội dung ghi âm một cách dễ dàng hơn. Tất nhiên, còn nhiều vấn đề xoay quanh bộ công cụ này. Điển hình như vẫn chưa rõ là nó có hỗ trợ tiếng Việt hay không (Do Adobe nói cần gõ chữ) và mặt khác, quá trình thao tác có đơn giản hay đòi hỏi kỹ thuật phức tạp để tinh chỉnh. Tuy nhiên, với tất cả những gì mà Photoshop làm được với ảnh thì đây thật sự là công cụ đáng hy vọng.


EmoticonEmoticon