Dịch giọng nói từ cuộc gọi trực tiếp: Công nghệ phá bỏ rào cản Ngôn Ngữ Của Google

Tại sự kiện Google I/O 2025, CEO Sundar Pichai đã chính thức công bố một bước tiến lớn trong công nghệ truyền thông: dịch giọng nói trực tiếp trong cuộc gọi, với khả năng khớp giọng nói, ngữ điệu và cả biểu cảm gần như theo thời gian thực.

Ông gọi đây là “công nghệ giúp phá vỡ rào cản ngôn ngữ”, hứa hẹn mở ra một kỷ nguyên giao tiếp mới giữa con người với nhau – tự nhiên, trôi chảy và kết nối hơn bao giờ hết.

Dịch giọng nói thời gian thực: Không còn giới hạn trong giao tiếp

Hãy tưởng tượng bạn đang nói tiếng Tây Ban Nha, nhưng người ở đầu dây bên kia – nói tiếng Anh – vẫn có thể hiểu bạn ngay lập tức bằng giọng nói đã được dịch sang ngôn ngữ của họ, vẫn giữ nguyên giọng điệu gốc của bạn. Đó không còn là tương lai xa, mà là tính năng mới của Google Meet – ứng dụng gọi video quen thuộc với hàng triệu người dùng.

Trong đoạn video demo tại sự kiện, Google cho thấy một cuộc gọi nơi người nói tiếng Tây Ban Nha được chuyển giọng sang tiếng Anh một cách tự nhiên, chỉ với độ trễ rất nhỏ. Đáng chú ý, giọng dịch được tạo ra từ chính giọng gốc của người nói, khiến trải nghiệm giao tiếp trở nên chân thực và sống động hơn rất nhiều.

Hình ảnh chụp từ Video

Công nghệ phía sau dịch giọng nói trực tiếp

Tính năng này là kết quả của dự án Starline mà Google khởi xướng từ năm 2021 – vốn tập trung vào việc tạo ra cảm giác “gặp mặt trực tiếp” trong các cuộc gọi từ xa. Bên cạnh AI ngôn ngữ, Starline còn phát triển hệ thống camera 3D để tái hiện hình ảnh người gọi.

Tại Google I/O 2025, hãng cũng giới thiệu thiết bị phần cứng mới mang tên Google Beam, phục vụ riêng cho các cuộc gọi trong dự án này, cho thấy tham vọng nâng tầm trải nghiệm giao tiếp ảo của Google.

Ứng dụng thực tiễn: Gắn kết gia đình, thúc đẩy công việc

Tính năng dịch giọng nói trực tiếp trong Google Meet không chỉ là “đồ chơi công nghệ” – mà có thể mang lại tác động thực sự trong đời sống và công việc:

  • 👨‍👩‍👧‍👦 Gắn kết gia đình đa quốc gia: Những gia đình sống tại nhiều quốc gia, nói nhiều ngôn ngữ khác nhau, giờ đây có thể trò chuyện dễ dàng mà không cần thông dịch viên.
  • 💼 Họp quốc tế không rào cản: Các công ty đa quốc gia có thể tổ chức cuộc họp trực tuyến giữa các thành viên nói các ngôn ngữ khác nhau mà không bị gián đoạn bởi ngôn ngữ.
  • 🤝 Tạo môi trường làm việc toàn cầu: Giao tiếp trôi chảy giữa các phòng ban quốc tế, hỗ trợ hiệu suất làm việc và tinh thần hợp tác xuyên biên giới.

Ai có thể sử dụng?

Hiện tại, tính năng này được Google triển khai trước tiên trên Google Meet, dành cho các thuê bao Google AI Pro và Ultra, hỗ trợ dịch giữa tiếng Anh và Tây Ban Nha. Google cho biết sẽ mở rộng thêm nhiều ngôn ngữ trong vài tuần tới, đồng thời triển khai thử nghiệm với các doanh nghiệp sử dụng Google Workspace.

Tương lai của giao tiếp số đang đến gần

Không đơn thuần là dịch ngôn ngữ, công nghệ mới này của Google là dịch giọng nói theo thời gian thực với độ chính xác cao và sự tinh tế trong biểu cảm. Đó là một bước tiến lớn giúp xóa nhòa ranh giới giữa các nền văn hóa và quốc gia.

Đối với những người đi làm, đặc biệt là trong môi trường đa quốc gia, đây là một tin vui lớn: bạn sẽ không còn phải phụ thuộc hoàn toàn vào trình độ ngoại ngữ của mình, mà vẫn có thể giao tiếp trôi chảy, chuyên nghiệp và đầy cảm xúc với đồng nghiệp toàn cầu.

Có thể bạn quan tâm