Xem bản thử nghiệm

AI "Rosetta" của Facebook có thể trích xuất văn bản từ 1 tỷ hình ảnh mỗi ngày

Tấn Minh , Theo Trí Thức Trẻ

Tính năng biên dịch tự động của mạng xã hội lớn nhất hành tinh này hiện còn có thể hoạt động với 24 ngôn ngữ mới.

Mọi người khi online không chỉ giao tiếp với nhau thông qua ngôn từ mà còn qua hình ảnh. Đối với một nền tảng như Facebook với hơn 2 tỷ người hoạt động mỗi tháng, điều đó có nghĩa là có vô số các hình ảnh được đăng tải mỗi ngày, bao gồm cả các meme. Nhằm đưa các hình ảnh đi kèm với văn bản vào các kết quả tìm kiếm hình ảnh tương ứng, để các chương trình đọc màn hình có thể hiểu được nội dung được viết trên các hình ảnh và đảm bảo chúng không chứa các nội dung xấu, các từ ngữ vi phạm chính sách nội dung của website, Facebook đã tạo và triển khai một hệ thống machine learning quy mô rộng gọi là "Rosetta".

Facebook cần một hệ thống nhận diện ký tự quang học có thể thường xuyên xử lý một lượng lớn nội dung, do đó họ phải "cầu cứu" đến công nghệ của riêng mình. Theo mạng xã hội này, Rosetta có thể trích xuất văn bản từ hơn 1 tỷ hình ảnh và khung hình video có bao gồm rất nhiều loại ngôn ngữ khác nhau mỗi ngày trong thời gian thực!

Trong một bài đăng blog mới, công ty đã giải thích cách thức hoạt động của Rosetta như sau: nó bắt đầu bằng cách phát hiện các vùng hình chữ nhật trong các hình ảnh có khả năng chứa văn bản. Sau đó, nó sử dụng một mạng thần kinh xoắn ốc để nhận diện và biên dịch nội dung được viết trong vùng đó, kể cả các từ không phải Tiếng Anh hay các ký tự không phải Tiếng Latin, như Ả-rập và Hindi. Để huấn luyện hệ thống này, Facebook đã sử dụng một tập hợp các hình ảnh công khai được ghi chú bởi cả con người lẫn máy tính.

AI Rosetta của Facebook có thể trích xuất văn bản từ 1 tỷ hình ảnh mỗi ngày - Ảnh 1.

AI của Facebook tìm kiếm các vùng hình chữ nhật có khả năng chứa văn bản trong một hình ảnh

Các nhóm khác nhau trong nội bộ Facebook và Instagram đã và đang sử dụng Rosetta để kiểm duyệt các nội dung và giữ cho các nền tảng mạng xã hội của họ luôn trong tình trạng "sạch sẽ". Công ty có dự định tiếp tục "dạy" cho AI của mình biết thêm nhiều ngôn ngữ nữa, đồng thời cải thiện kỹ năng trích xuất văn bản từ các khung hình video của nó.

Hiện Facebook đã thêm vào dịch vụ biên dịch tự động của mình 24 ngôn ngữ mới, bao gồm tiếng Serbia, Belarus, Marathi, Sinhal, Telugu, Nepal, Kannada, Urdu, Punjabi, Cambodia, Pashto, Mongolia, Zulu, Xhosa và Somali. Facebook thừa nhận rằng khả năng biên dịch các ngôn ngữ mới thêm vào này vẫn còn ở giai đoạn sơ khai, do đó sẽ có khá nhiều lỗi biên dịch. Hãng dự định tiếp tục cải tiến chúng và giới thiệu thêm nhiều ngôn ngữ nữa trong tương lai.

Tham khảo: Engadget

Bình luận