5 cách tôi ước Apple sẽ cho phép tôi sử dụng giọng nói nhân bản AI của mình

Tác giả AI+, T.Sáu 04, 2024, 07:15:11 CHIỀU

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 2 Khách đang xem chủ đề.

Hãy nói về một số điều thú vị mà chúng ta có thể làm với tính năng Giọng nói cá nhân của Apple.

  • Giọng nói cá nhân của Apple cho phép bạn tạo một bản sao tổng hợp giọng nói của mình cho các tác vụ trợ năng.
  • Tính năng này có thể có nhiều công dụng hơn, như phản hồi tự động, tường thuật và bảo vệ danh tính.
  • Những điều thú vị khác mà chúng tôi có thể làm với bản sao giọng nói của mình bao gồm bộ lọc giọng nói cho cuộc họp và bản dịch trực tiếp.


Giọng nói cá nhân của Apple cho phép bạn tạo một bản sao tổng hợp giọng nói của mình bằng AI trong iOS và macOS. Mặc dù đây là một tính năng tiện lợi nhưng nó khá hạn chế về những gì bạn có thể làm với nó. Chúng tôi nghĩ rằng việc hạn chế sử dụng nó một cách nghiêm ngặt đối với các tính năng trợ năng là một cơ hội bị bỏ lỡ.

1. Giọng nói cá nhân của Apple hoạt động như thế nào?

Apple Personal Voice được phát hành cùng với iOS 17 và macOS Sonoma, đồng thời được hỗ trợ trên các thiết bị từ iPhone 12 trở đi cũng như máy Mac Apple Silicon. Để thiết lập, hãy đi tới Cài đặt (Hệ thống) > Trợ năng > Giọng nói cá nhân và đọc to danh sách các cụm từ, sau đó cắm thiết bị qua đêm để thiết bị có thể xử lý và sao chép giọng nói của bạn bằng AI.

Bạn phải đọc to 150 cụm từ để ghi lại tất cả các âm thanh và biến điệu trong giọng nói đặc biệt của mình, vì vậy có thể bạn sẽ muốn dành một giờ cho việc này (và bạn sẽ phát ngán với âm thanh giọng nói của chính mình khi bạn đọc nó). xong rồi).

Hiện tại, bạn chỉ có thể sử dụng giọng nói cá nhân nhân bản của mình cho các tác vụ Trợ năng trong iOS, chẳng hạn như sử dụng giọng nói đó để nói trong cuộc gọi điện thoại và đọc to văn bản trực tiếp từ loa điện thoại của bạn. Với một công nghệ tuyệt vời sẵn có, chạy an toàn trên thiết bị của bạn, chúng tôi nghĩ rằng có cơ hội để Apple cho phép bạn làm được nhiều hơn với nó.

Đây là những gì chúng tôi muốn làm với tiếng nói cá nhân của mình (các nhà phát triển ứng dụng hãy lưu ý).

2. Phản hồi tự động bằng giọng nói của chính bạn

Hãy tưởng tượng nếu iPhone của bạn có thể trả lời cuộc gọi cho bạn, hỏi một số câu hỏi cơ bản bằng giọng nói của bạn và sau đó chỉ thông báo cho bạn nếu cuộc gọi đó quan trọng. Đó là một cách tuyệt vời để lọc ra những người tiếp thị qua điện thoại và những cuộc gọi không khẩn cấp (chẳng hạn như đối tác của bạn cho bạn biết họ đã đến cửa hàng hoặc xác nhận cuộc hẹn từ bác sĩ của bạn) có thể được tóm tắt và gửi cho bạn qua iMessage.

Điều này sẽ đặc biệt hữu ích khi bạn đang lái xe hoặc xem phim và không thể sử dụng điện thoại của mình.

3. Tường thuật cho video và thuyết trình

Không phải ai cũng là một người kể chuyện tuyệt vời. Có thể khó nói một cách nhất quán và rõ ràng khi đọc từ một kịch bản. Ngược lại, có thể khó hình thành những điều bạn muốn nói một cách tự nhiên khi nói không theo kịch bản. Khả năng viết bản ghi những gì bạn muốn nói và sau đó xuất văn bản nói thu được dưới dạng tệp âm thanh có thể rất phù hợp cho podcast, video trên YouTube và bản trình bày để trợ giúp những người không phải là diễn giả giỏi trước công chúng.

Chắc chắn, Personal Voice vẫn chưa được Apple hoàn thiện và đôi khi có thể nghe hơi giống robot. Nhưng theo thời gian, khi tính năng này hoàn thiện hơn, nó sẽ trở nên thuyết phục hơn.

4. Mang đến cho bạn giọng nói hoàn hảo

Bạn đã bao giờ gọi điện cho người bị cảm lạnh hoặc đau họng chưa? Chúng nghe có vẻ không hay lắm và điều này có thể để lại ấn tượng xấu. Một giọng nói được nhân bản bằng AI có thể được sử dụng để làm dịu đi điều đó, loại bỏ âm thanh mũi 'nghẹt mũi', đánh hơi, ho và hắng giọng khi bạn đang họp. Nó cũng có thể được sử dụng để làm cho âm thanh rõ hơn khi kết nối kém hoặc trong môi trường ồn ào.

5. Bảo vệ giọng nói và danh tính của bạn khỏi bị những kẻ lừa đảo sử dụng

Nếu iOS có thể sao chép giọng nói của bạn, nó sẽ có thể phát hiện xem có ai khác đang làm điều tương tự mà không có sự cho phép của bạn hay không. Điều này đặc biệt có liên quan vì các hành vi lừa đảo nhân bản giọng nói ngày càng trở nên phổ biến (sử dụng các bản ghi âm của bạn lấy từ mạng xã hội).

Bằng cách chia sẻ an toàn dấu vân tay giọng nói của bạn với gia đình iCloud và các liên hệ đáng tin cậy khác, họ có thể được cảnh báo nếu nhận được cuộc gọi đang cố sử dụng bản sao giọng nói không thực sự đến từ bạn. Điều này sẽ rất phù hợp với sự tập trung của Apple vào quyền riêng tư và bảo mật của người dùng.

6. Bản dịch trực tiếp

Có lẽ cơ hội bị bỏ lỡ rõ ràng nhất trong số rất nhiều cơ hội. Nói vào điện thoại của bạn và yêu cầu ứng dụng Dịch tạo ra bản dịch trực tiếp giọng nói của bạn. Làm thế nào mát mẻ mà sẽ là gì? Hãy thuyết phục bạn bè rằng bạn đã học tiếng Phần Lan vào cuối tuần!

Tính năng Giọng nói cá nhân gần như bị ẩn trong iOS và macOS và chưa được quảng cáo rộng rãi. iOS có nhiều tính năng ẩn khác mà có thể bạn chưa biết, vì vậy hãy nhớ kiểm tra chúng và xem liệu có tính năng nào trong đó giúp cuộc sống của bạn dễ dàng hơn không.