• Home
  • Site Map
  • Contact
  • Login
    • Register
  • Subscribe
Side Logo

Travel News

Trang tin du lịch

  • Home
  • Tin tức - Sự kiện
    • Thống kê du lịch
    • Chuyện lạ
  • Dịch vụ du lịch
    • Khám phá
    • Ẩm thực
    • Người Du lịch
    • Dự án đầu tư Du lịch
  • Visa, hộ chiếu
  • Thông tin cần biết
    • Đến Việt Nam
    • Tại Việt Nam
    • Giao thông
    • Thông tin khác
  • Văn Hóa
    • Giá trị lịch sử
    • Ngôn ngữ văn học
    • Lễ hội, trò chơi dân gian
    • Nghệ thuật biểu diễn
    • Trang phục
    • Kiến trúc, mỹ thuật
    • Món ăn, hoa, trái
    • Chợ Việt Nam
    • Phong tục tập quán
    • Tín ngưỡng - Tâm linh
    • Tết Việt Nam
  • Kinh nghiệm du lịch
  • Nhìn ra thế giới
  • Doanh nghiệp du lịch
  • UKEnglish

Công nghệ du lịch

Mô hình AI của OpenAI tự động nhận dạng giọng nói và dịch sang tiếng Anh

27/9/2022 02:16 486
Ngày 21/9, OpenAI phát hành một mô hình AI mã nguồn mở mới có tên là Whisper có thể nhận dạng và dịch âm thanh ở cấp độ tiếp cận với khả năng nhận dạng con người qua giọng nói.

Theo nhóm phóng viên của Ars Technica, phần mềm mã nguồn mở Whisper có thể ghi lại các cuộc phỏng vấn, podcast, cuộc trò chuyện, nhận dạng âm thanh của các ngôn ngữ khác nhau, phiên dịch ra Tiếng Anh và lưu thành văn bản. Phần mềm có khả năng tự học và có thể được phát triển để nhận dạng con người qua giọng nói.

OpenAI đã đào tạo Whisper trên 680.000 giờ dữ liệu âm thanh và bảng dịch lại khớp với 98 ngôn ngữ được thu thập từ web. Theo OpenAI, phương pháp tiếp cận tập hợp mở này mang đến "sự tăng cường độ chính xác của các trọng âm, làm rõ tiếng ồn xung quanh và kỹ thuật ngôn ngữ." Phần mềm cũng có khả năng phát hiện ngôn ngữ nói và dịch sang tiếng Anh.

OpenAI mô tả Whisper như một mô hình biến đổi mã hóa-giải mã, một loại mạng thần kinh có thể sử dụng ngữ cảnh thu thập được từ dữ liệu đầu vào, tìm hiểu các liên kết tình huống, sau đó có thể được dịch sang ngôn ngữ cần thiết ở đầu ra của mô hình. OpenAI trình bày tổng quan về phương thức hoạt động của Whisper:

Âm thanh đầu vào được chia thành các đoạn dài 30 giây, chuyển đổi thành biểu đồ quang phổ log-Mel và sau đó chuyển vào bộ mã hóa. Một bộ giải mã được đào tạo để dự đoán văn bản chú thích tương ứng, trộn lẫn với các mã thông báo đặc biệt, chỉ đạo mô hình duy nhất thực hiện các tác vụ như nhận dạng ngôn ngữ, khoảng thời gian của các cụm từ, phiên âm giọng nói đa ngôn ngữ và dịch giọng nói sang tiếng Anh.

Sử dụng mã nguồn mở Whisper, OpenAI hy vọng sẽ giới thiệu một mô hình nền tảng mới mà những chuyên gia công nghệ khác, có thể cùng xây dựng và phát triển trong tương lai để nâng cấp các công cụ hỗ trợ tiếp cận và xử lý giọng nói.

OpenAI có một thành tích đáng kể trên lĩnh vực này. Tháng 1/2021, OpenAI phát hành CLIP , một mô hình thị giác máy tính mã nguồn mở, mở đầu cho kỷ nguyên công nghệ tổng hợp hình ảnh đang phát triển nhanh chóng gần đây như DALL-E 2 và Stable Diffusion .

Tại Ars Technica, nhóm phóng viên đã thử nghiệm Whisper từ mã có sẵn trên GitHub, cung cấp cho mô hình nhiều mẫu, bao gồm một tệp podcast (tệp âm thanh) và một phần âm thanh đặc biệt khó hiểu, được lấy từ một cuộc phỏng vấn qua điện thoại. Mặc dù phải mất một khoảng thời gian khi chạy qua CPU máy tính để bàn tiêu chuẩn của Intel (công nghệ Whisper chưa hoạt động được trong thời gian thực) nhưng Whisper đã thực hiện tốt việc chuyển âm thanh thành văn bản thông qua chương trình Python trình diễn, tốt hơn nhiều so với một số ứng dụng AI hỗ trợ dịch vụ phiên âm mà Ars Technica đã thử dùng trước đây.

Ví dụ bảng điều khiển đầu ra từ chương trình Whisper của OpenAI khi phiên âm một podcast.

Với thiết lập phù hợp, Whisper có thể dễ dàng được sử dụng để phiên âm các cuộc phỏng vấn, podcast và có khả năng dịch các podcast được tạo từ các ngôn ngữ không phải tiếng Anh sang tiếng Anh trên máy tính miễn phí. Đây là sự kết hợp công nghệ mạnh mẽ mà sự phát triển có thể phá vỡ ngành công nghiệp phiên dịch.

Như với hầu hết các mô hình AI hiện nay, Whisper mang lại những lợi thế tích cực và khả năng bị lạm dụng. Trên thẻ mô hình của Whisper (trong phần "Hàm ý rộng hơn"), OpenAI cảnh báo rằng Whisper có thể bị sử dụng để tự động hóa việc giám sát theo điện thoại hoặc xác định từng người nói trong một cuộc trò chuyện, nhưng công ty hy vọng công nghệ sẽ được sử dụng "chủ yếu cho các mục đích có ích cho nhân loại".

Trịnh Thái Bằng

Nguồn: VietTimes

Trở về đầu trang
   OpenAI mô hình AI phiên dịch các loại ngôn ngữ tiếng Anh lưu văn bản
0   Tổng số:

Các tin khác

  • Đặt dịch vụ du lịch trực tuyến: cần cảnh giác và lựa chọn an toàn
  • Từ 1/12 mua vé máy bay, kiểm tra an ninh sẽ bằng VNeid và sinh trắc học
  • Du lịch Quảng Ninh trên hành trình số hóa
  • Ra mắt show đêm “Lửa Xô-viết” - Tái hiện lịch sử bằng ánh sáng và nghệ thuật 3D mapping
  • Trải nghiệm lịch sử bằng 'đa giác quan' ở bảo tàng
  • Các "ông lớn" ngành du lịch đang đầu tư mạnh tay vào AI
  • Du lịch TP.HCM lần đầu triển khai hệ thống theo dõi dữ liệu du khách
  • Ứng dụng trí tuệ nhân tạo trong du lịch: Xu hướng mới của người Việt
  • Ứng dụng trí tuệ nhân tạo trong du lịch: Xu hướng mới của người Việt
  • AI tác động đến du lịch: Hiệu ứng tích cực sẽ thắng thế
  • 12345...>>

Tin đọc nhiều

  • Những địa điểm lý tưởng xem diễu binh, diễu hành...

    Sáng 2/9, Lễ diễu binh và diễu hành kỷ niệm 80 năm Cách mạng Tháng Tám và Quốc khánh 2/9...

    214
  • Đà Nẵng khởi công siêu tổ hợp văn hóa vui chơi...

    Ngày 19/8, Tập đoàn Sun Group phối hợp Ủy ban nhân thành phố Đà Nẵng tổ chức lễ khởi công...

    213
  • Đòn bẩy nào để du lịch y tế Việt Nam cán mốc 4 tỷ...

    Nhìn vào mô hình du lịch y tế của các quốc gia lân cận có thể thấy, Thái Lan thu về 600 -...

    212
  • Du khách leo núi liên tiếp lạc đường, khu du lịch...

    Trong hai ngày cuối tuần vừa qua (16-17/8), Ban Quản lý Khu du lịch Quốc gia Núi Bà Đen...

    204
  • Những tour du lịch đặc sắc tại “tâm điểm Hà Nội"

    Kỳ nghỉ lễ Quốc khánh 2/9 năm nay chứng kiến thị trường du lịch nội địa sôi động chưa...

    186

- Trang thông tin du lịch
- Email: didulich.net@gmail.com
 

© 2025 Trang thông tin du lịch