coincuatui-banner

"Start-up Ai được Nvidia đầu tư ra mắt hình tượng biểu lộ cảm xúc của con người"

Start-up AI được Nvidia đầu tư ra mắt hình tượng biểu lộ cảm xúc của con người

Start-up AI Synthesia được Nvidia đầu tư đã ra mắt “Expressive Avatars,” cho phép trí tuệ nhân tạo truyền đạt cảm xúc và chuyển động của con người trong các bài thuyết trình và đào tạo doanh nghiệp.

Start-up AI được Nvidia đầu tư ra mắt hình tượng biểu lộ cảm xúc của con người

Synthesia, một start-up trí tuệ nhân tạo (AI) được hỗ trợ bởi Nvidia, đã giới thiệu bản nâng cấp mới cho phép các hình tượng trí tuệ nhân tạo truyền đạt cảm xúc và chuyển động của con người.

Vào ngày 25 tháng 4, công ty đã ra mắt “Expressive Avatars,” với mục tiêu biểu lộ cảm xúc dựa trên hướng dẫn văn bản cho các bài thuyết trình doanh nghiệp, marketing và đào tạo.

Mặc dù trí tuệ nhân tạo tạo ra hình ảnh chuyển động thực tế nhiều khi được khen ngợi, như trường hợp của Sora video generator của OpenAI.

Tuy nhiên, trí tuệ nhân tạo không thể tránh khỏi những khiếm khuyết, đặc biệt khi miêu tả con người, thường được thể hiện với bàn tay hoặc chiếc cẳng bị biến dạng, nền nghịch, hoặc môi không đồng bộ với lời nói.

Synthesia mục tiêu sửa chữa vấn đề này trong phiên bản mới nhất của mình, được phát triển từ con người thực đang đọc kịch bản tại studio của họ. Điều này giúp bot có thể bắt môi, học theo và trở nên chính xác hơn trong việc biểu lộ cảm xúc.

Victor Ribarbelli, CEO và đồng sáng lập của Synthesia, nói trong một video rằng mảnh ghép bị thiếu là, khác với con người, “hình tượng không hiểu họ đang nói gì” đã dẫn đến việc thiếu phản ứng trên khuôn mặt đối với cảm xúc.

Tại studio, họ đã được huấn luyện để phản ứng với các hướng dẫn đơn giản như, “Tôi vui. Tôi buồn. Tôi bực mình” bằng cách biểu lộ các biểu cảm khuôn mặt và giọng điệu đúng cho cảm xúc được cho trước.

Nguồn: Synthesia

Các hình tượng mới cũng có sẵn trong hơn 130 ngôn ngữ, có thể cung cấp phụ đề riêng và thậm chí sao chép giọng của người dùng. 

Liên quan: Sam Altman đẩy mạnh việc sử dụng ChatGPT phổ biến trong các công ty Fortune 500: Báo cáo

Tuy nhiên, trong các mô hình hình tượng ví dụ trên trang web của Synthesia nói tiếng không phải là tiếng Anh như Pháp, Đức và Tây Ban Nha, mô hình tiếng Anh là mô hình tiên tiến và giống con người hơn, theo kiểm tra của Coincuatui về mô hình.

Rumor bảo rằng công ty đã có ít nhất một nửa các công ty trong Fortune 100 được liệt kê là khách hàng và cung cấp dịch vụ cho hơn 55.000 doanh nghiệp. Điều này bao gồm lãnh đạo trong các ngành công nghiệp khác nhau như Zoom, Xerox, Microsoft và Reuters, trong số những người khác. 

Synthesia là công ty có trụ sở tại Vương quốc Anh được thành lập vào năm 2017. Trên nền của cú sốc trí tuệ nhân tạo trong năm qua, họ đã đạt đến một giá trị xấp xỉ 1 tỷ đô la với các nhà đầu tư lớn như Nvidia — người hiện đang thống trị trong phát triển chip bán dẫn trí tuệ nhân tạo.

Do cách tiếp cận tập trung hơn — tạo ra hình tượng giống con người cho mục đích kinh doanh — Synthesia đã tránh xa một số hiệu ứng và cạnh tranh mạnh mẽ nhìn thấy giữa các mô hình chatbot cạnh tranh như ChatGPT của OpenAI và chatbot Gemini của Google.

Tạp chí: Làm thế nào để có dự báo tiền điện tử tốt hơn từ ChatGPT, châm ngôn AI nhân văn bị chỉ trích: AI Eye

Nguồn: Cointelegraph

Xem thêm