Khi gương mặt có giá tới hàng tỷ USD

Nguyễn Hải , Theo Trí Thức Trẻ

Với tầm nhìn xa của mình, Megvii đã xây dựng nên các nền tảng để biến công nghệ nhận diện gương mặt trở thành một phần trong cơ sở hạ tầng Web và internet.

Ở Trung Quốc, nhận diện gương mặt đang chuyển đổi nhiều mặt của cuộc sống hàng ngày. Các nhân viên tại hãng thương mại điện tử khổng lồ Alibaba ở Shenzhen có thể dùng gương mặt để bước vào tòa nhà văn phòng của mình thay vì phải quẹt thẻ ID.

Một bến tàu điện ở phía tây Bắc Kinh quét gương mặt hành khách để khớp vé của họ với mã ID do chính phủ cung cấp. Nếu gương mặt của họ khớp với hình ảnh trên thẻ ID, hệ thống sẽ xác nhận vé của họ hợp lệ và cửa ga tàu sẽ mở ra. Hệ thống tàu điện ngầm ở Hàng Châu, một thành phố nằm cách Thượng Hải 125 dặm về phía tây nam, đã sử dụng các camera giám sát có thể nhận diện gương mặt để phát hiện các kẻ tình nghi phạm tội.

Công nghệ nào đứng đằng sau tất cả các ứng dụng này? Face++, nền tảng công nghệ nhận diện gương mặt lớn nhất thế giới, hiện đang được sử dụng bởi hơn 300.000 nhà phát triển trong 150 quốc gia trên thế giới để nhận diện gương mặt, cũng như hình ảnh, văn bản và các loại mã ID do chính phủ phát hành.

Một công nghệ làm nên cơ sở hạ tầng internet hiện đại

Các công ty Trung Quốc khác, như Baidu và startup SenseTime, cũng cung cấp công nghệ nhận diện gương mặt cho các nhà phát triển, nhưng tính phổ biến của Face++ đã là một lợi thế hơn hẳn của Megvii, công ty tại Bắc Kinh đã tạo ra và vận hành nền tảng này. Được ba sinh viên tốt nghiệp đại học Thanh Hoa sáng lập vào năm 2011, Megvii giờ có giá trị đến gần một tỷ USD và có đến 530 nhân viên, mức tăng trưởng mạnh mẽ so với con số 30 nhân viên vào năm 2014.

Megvii tin rằng, khi internet chiếm ngày càng nhiều chức năng thương mại và xã hội hơn, nhận diện gương mặt sẽ trở thành một phần trong cơ sở hạ tầng của Web với ý nghĩa như một công cụ để xác nhận, cho dù chúng đều là các hành động cần phải có các danh tính thực. Các công ty công nghệ khác dường như cũng đang đánh cược vào nhận định này: bộ đôi điện thoại Samsung Galaxy S8 và S8+ đều hỗ trợ khả năng nhận diện gương mặt (để mở khóa thiết bị), và theo các tin đồn Apple cũng đang trang bị cho chiếc iPhone 8 sắp ra mắt công nghệ đó.


API Face ID để các công ty khác tích hợp vào ứng dụng của mình.

API Face ID để các công ty khác tích hợp vào ứng dụng của mình.

Face ID, nền tảng xác thực danh tính trực tuyến, là một cách Face++ đang được tích hợp vào cơ sở hạ tầng internet. (Giao diện API so sánh gương mặt của Face ID cũng sử dụng công nghệ Face++). Theo Yin, CEO của Megvii, gần 90% trong số top 200 công ty internet hàng đầu của Trung Quốc sử dụng Face ID.

Nền tảng này đặc biệt phổ biến trong các dịch vụ tài chính trực tuyến khi họ cần để xác định danh tính người dùng từ xa. (Để tránh bị đánh lừa hoặc qua mặt bằng các bức ảnh, nhưng ứng dụng này thường thực hiện một “bài kiểm tra tính người” bằng cách đòi hỏi người dùng nói hoặc dịch chuyển đầu).

Xiaohua, công ty đang vận hành một ngân hàng ảo nhằm cấp phép cho các khoản vay và cung cấp các dịch vụ thanh toán từng phần thông qua một ứng dụng di động có tên gọi Xiaohua Qianbao (nghĩa là chiếc Ví hoa nhỏ), là một khách hàng điển hình của Face ID. Người dùng sẽ quét gương mặt họ bằng ứng dụng để được chấp nhận khoản vay và để đảm bảo không ai khác có thể thao tác trên ứng dụng nếu điện thoại của họ bị mất hoặc bị trộm mất.

Xiaohua Qianbao là một sản phẩm cho mượn và cho vay hoàn toàn trực tuyến, vì vậy nhu cầu đầu tiên của chúng tôi là chống gian lận.” Lingpeng Huang, đồng sáng lập của Xiaohua, cho biết. “Nhận diện gương mặt đã loại bỏ rủi ro của việc làm giả danh tính.”

Các nền tảng này được tạo ra như thế nào

Các thuật toán đứng đằng sau Face++ và Face ID được Megvii đào tạo bằng cách cung cấp các bộ dữ liệu khổng lồ vào một engine học sâu có tên Brain++. (Kỹ thuật học sâu tham gia vao bằng cách nạp các ví dụ vào mạng lưới thần kinh nhân tạo rộng lớn, nhiều lớp, và tinh chỉnh các yếu tố của nó cho đến khi nó nhận ra một cách chính xác các đặc điểm mong muốn, ví dụ khuôn mặt của một người cụ thể nào đó.)

Để thu được số lượng khổng lồ các dữ liệu đào tạo này, Megvii để phần lớn nhà phát triển của mình sử dụng Face++ miễn phí trong suốt hai năm đầu tiên sau khi xuất hiện của nền tảng này. Megvii cũng mua các bức ảnh từ các công ty thu thập dữ liệu để hỗ trợ cho việc đào tạo.

Công ty xây dựng Brain++ vào năm 2015 và cho biết engine học sâu này có khả năng tự phát triển, giúp nó tự đào tạo các thuật toán của mình hiệu quả hơn. “Nó đang làm tăng khả năng cạnh tranh cho sản phẩm của chúng tôi.” Jian Sun, nhà khoa học trưởng của Megvii cho biết.

Một lợi thế khác của việc có một nền tảng học sâu của riêng mình: giờ đây Megvii có thể tự mình tùy chỉnh công nghệ nhận diện gương mặt của mình cho các khách hàng khác nhau một cách dễ dàng. Điều này rất quan trọng, bởi vì ví dụ như, cơ quan cảnh sát sẽ yêu cầu tính chính xác lên cao hơn hết, trong khi đó, một công ty sử dụng việc nhận diện gương mặt trên ứng dụng di động sẽ chỉ cần đảm bảo rằng phần mềm đó đủ nhỏ để đặt vừa bên trong ứng dụng – mà không bị mất quá nhiều tính chính xác.

Khi CEO Qi Yin ra mắt Megvii, anh muốn công ty trở thành dẫn đầu chỉ trong một vài lĩnh vực quan trọng. “Một công ty AI phải là số 1 trong một hoặc hai ngành công nghiệp cốt lõi trước khi thành công trong các lĩnh vực khác.” Anh cho biết.

Giờ đây Face++ đang tiến sâu hơn vào ngành ngân hàng và tài chính, các đồng sáng lập của Megvii có kế hoạch tích hợp khả năng nhận diện gương mặt và các công nghệ thị giác máy tính khác vào nhiều ngành công nghiệp hơn, ví dụ như bán lẻ hoặc xe tự lái.

Để điều đó xảy ra, theo Jiansheng Chen, giáo sư tại Đại học Thanh Hoa, người nghiên cứu về thị giác máy tính cho biết, công ty cần cho các ngành công nghiệp đó thấy, họ sẽ được hưởng lợi như thế nào khi dùng công nghệ này, ví dụ như có thể giảm được nạn gian lận như thế nào sau mỗi năm.

Tham khảo Technology Review

Bình luận