Meta dùng dữ liệu người dùng Facebook, Instagram đào tạo chatbot AI

29/9

649

Meta dùng dữ liệu người dùng Facebook, Instagram đào tạo chatbot AI

Meta cho biết dùng bài viết Facebook, Instagram công khai của người dùng để đào tạo trợ lý ảo trí tuệ nhân tạo (AI) mới, nhưng loại trừ nội dung chỉ chia sẻ cho gia đình, bạn bè.

Trong cuộc phỏng vấn với Reuters, Nick Clegg – Chủ tịch Các vấn đề toàn cầu Meta – cho biết công ty sử dụng các bài viết Facebook và Instagram công khai để đào tạo trợ lý ảo AI mới. Tập đoàn không dùng những đoạn chat cá nhân của người dùng và cũng áp dụng các biện pháp để lọc thông tin riêng tư khỏi bộ dữ liệu công khai.

“Chúng tôi cố gắng loại bỏ các bộ dữ liệu trội hơn về thông tin cá nhân”, ông Clegg chia sẻ. Phần lớn dữ liệu mà Meta dùng để đào tạo được công khai trên mạng. Dù vậy, nền tảng tuyển dụng LinkedIn là một trong những website công ty không chọn vì vấn đề quyền riêng tư.

CEO Meta Mark Zuckerberg phát biểu tại sự kiện Connect 2023 ngày 27/9 tại trụ sở Menlo Park, California, Mỹ. (Ảnh: Reuters)

Bình luận được ông Clegg đưa ra giữa lúc các hãng công nghệ như Meta, OpenAI, Google đang bị chỉ trích vì sử dụng thông tin lấy từ Internet mà không được sự cho phép để đào tạo các mô hình AI.

Các hãng đang cân nhắc làm thế nào để xử lý dữ liệu riêng tư, bản quyền, trong khi phải đối mặt với các vụ kiện từ những tác giả cáo buộc họ vi phạm bản quyền.

Meta AI là sản phẩm quan trọng nhất trong số các công cụ AI dành cho người dùng vừa được Meta công bố tại sự kiện sản phẩm thường niên Connect. AI thống trị Connect năm nay, khác với các sự kiện trước chỉ tập trung vào thực tế ảo và thực tế tăng cường.

Meta AI dựa vào mô hình ngôn ngữ lớn Llama 2, có khả năng tạo ra hình ảnh, âm thanh, văn bản và được tiếp cận thông tin thời gian thực thông qua hợp tác với công cụ tìm kiếm Bing của Microsoft. Những bài viết Facebook và Instagram công khai được dùng để đào tạo Meta AI gồm cả ký tự và ảnh.

Theo lãnh đạo Meta, công ty còn áp đặt hạn chế an toàn đối với nội dung mà công cụ có thể tạo ra, chẳng hạn cấm tạo ảnh giống với các nhân vật của công chúng.

Một số công ty đã trả tiền cho nội dung bản quyền hoặc không đưa chúng vào dữ liệu đào tạo. OpenAI, nhà phát triển ChatGPT, đã ký thỏa thuận 6 năm với nhà cung cấp nội dung Shutterstock mùa hè năm nay để sử dụng thư viện hình ảnh, video và nhạc.

Khi được hỏi Meta có áp dụng biện pháp nào để tránh tái tạo lại hình ảnh bản quyền hay không, người phát ngôn công ty nhắc đến các điều khoản dịch vụ mới, cấm người dùng tạo ra nội dung vi phạm quyền riêng tư và quyền sở hữu trí tuệ.

(Theo Reuters)