7.500 lập trình viên giấu mặt đang tạo nên hệ thống trí tuệ nhân tạo quản lý được một quỹ đầu cơ

    Nguyễn Hải,  

    Một sự kết hợp đầy đủ giữa Phố Wall và Thung lũng Silicon.

    Người ta thường cho rằng, trong lĩnh vực chứng khoán, phần thưởng cho người chiến thắng không nhất thiết dành cho số đông, nhưng liệu số đông có làm nên chiến thắng cho một ai đó không?. Bằng công nghệ điện toán, một quỹ đầu cơ đang cố gắng tìm ra lời giải cho câu hỏi đó.

    Richard Craib là một nhà đầu tư Nam Phi 29 tuổi, anh đang điều hành một quỹ đầu cơ (hedge fund) tại San Francisco. Hay nói đúng hơn, anh không điều hành nó. Anh để việc đó cho một hệ thống trí tuệ nhân tạo được xây dựng bởi hàng nghìn nhà khoa học về dữ liệu, những người mà anh cũng chẳng biết tên.

    Dưới cái tên Numerai, Craib và các thành viên trong startup của mình đã xây dựng một công nghệ giúp che giấu các dữ liệu giao dịch của quỹ, trước khi chia sẻ nó với cộng đồng đông đảo những nhà khoa học dữ liệu ẩn danh.

    Trí tuệ nhân tạo từ cộng đồng

    Sử dụng một phương pháp tương tự như mã hóa đồng cấu (homomorphic encryption: phương pháp thực hiện các phép tính trên thông tin mã hóa mà không phải giải mã nó), công nghệ này giúp đảm bảo các nhà khoa học sẽ không thể thấy được chi tiết trong những giao dịch độc quyền của công ty, nhưng vẫn có thể tổ chức dữ liệu. Vì vậy, các nhà khoa học này có thể xây dựng các mô hình máy học để phân tích dữ liệu giao dịch, như vậy, về mặt lý thuyết, quỹ này có thể tìm ra những cách tốt hơn để giao dịch các chứng khoán tài chính.

    Chúng tôi cho đi mọi dữ liệu của mình,” Craib, người từng nghiên cứu toán học tại Đại học Cornell ở New York trước khi làm việc tại một hãng quản lý tài sản ở Nam Phi, cho biết. “Nhưng chúng tôi chuyển nó thành dạng dữ liệu trừu tượng hóa, để mọi người có thể xây dựng các mô hình máy học cho dữ liệu mà không cần biết chúng đang làm gì.”

    Anh cũng không biết các nhà khoa học dữ liệu này là ai vì anh tuyển dụng họ trực tuyến và trả công cho họ bằng tiền kỹ thuật số để đảm bảo được tính ẩn danh. “Ai cũng có thể gửi các dự đoán trở lại cho chúng tôi.” Anh nói. “Nếu chúng hiệu quả, chúng tôi sẽ trả họ bằng bitcoin.”

    Vậy tóm lại là: họ không biết được dữ liệu của anh là gì. Anh cũng không biết họ là ai. Và bởi vì họ làm việc trên các dữ liệu mã hóa, họ không thể sử dụng các mô hình máy học của mình cho các dữ liệu khác – và cả anh cũng vậy. Nhưng Craib tin rằng, một người mù dẫn dắt một người mù có thể đi đến một quỹ đầu cơ hiệu quả hơn.

    Công ty công nghệ cho ngành công nghiệp tài chính

    Quỹ của Numerai đã giao dịch cổ phiếu trong một năm nay. Cho dù anh từ chối cho biết thành công của mình đến đâu, do các quy định của chính về việc công bố những thông tin này, nhưng anh cho biết hiện quỹ đang kiếm được tiền. Và ngày càng nhiều hơn các nhà đầu tư tên tuổi bơm tiền vào công ty của anh, bao gồm cả nhà sáng lập ra Renaissance Technologies, một quỹ đầu cơ “định lượng” nổi tiếng thành công nhờ phương pháp phân tích dữ liệu.

    Craib và công ty mới chỉ hoàn tất vòng gọi vốn đầu tiên, với người dẫn đầu là Union Squares Ventures, công ty đầu tư mạo hiểm ở New York. Union Squares đã đầu tư 3 triệu USD trong vòng này, ngoài ra công ty còn thu được 3 triệu USD từ các nhà đầu tư khác.

    Các quỹ đầu cơ đang khám phá việc sử dụng các thuật toán máy học trong một thời gian, bao gồm cả những tên tuổi lớn của Phố Wall như Renaissance và Bridgewater Associates, cũng như các startup công nghệ như Sentinent Technologies và Aidyia. Nhưng quỹ của Craib đại diện cho nỗ lực mới khi huy động sức mạnh của cộng đồng trong việc tạo ra các thuật toán này. Một số startup khác cũng làm việc trong những dự án tương tự, như Two Sigma, một quỹ đầu cơ tại New York dùng trung tâm dữ liệu bổ sung. Nhưng nỗ lực của Numerai là điều gì đó dường như mạnh mẽ hơn cả.

    Công ty có phong cách giống Thung lũng Silicon nhiều hơn một quỹ đầu cơ: một startup nhỏ xíu với tham vọng định hình lại ngành công nghiệp tài chính thông qua trí tuệ nhân tạo, mã hóa, đóng góp của đám đông và bitcoin. Có lẽ điều duy nhất còn thiếu là thực tế ảo. Và chắc chắn một điều, hiện vẫn còn khá sớm cho Numerai. Thậm chí một trong những nhà đầu tư của họ, Andy Weissman, đối tác tại Union Square, cũng gọi họ chỉ là một “thí nghiệm.”

    Như Weissman thừa nhận, cách giản đồ của Numerai hoạt động vẫn còn là một nghi vấn. Vấn đề với mã hóa đồng cấu là nó có thể làm chậm đi đáng kể tác vụ phân tích dữ liệu. “Mã hóa đồng cấu đòi hỏi một lượng thời gian tính toán cực lớn.” Theo Ameesh Divatia, CEO của Baffle, một công ty đang tạo ra cách mã hóa tương tự Numerai. Tuy nhiên, Craib cho biết, Numerai giải quyết vấn đề tốc độ bằng định dạng mã hóa riêng của họ, nhưng Divatia cảnh báo rằng điều này có thể dẫn đến sự đánh đổi về bảo mật dữ liệu.

    Theo Raphael Bost, một nhà khoa học tại Phòng thí nghiệm về AI và Khoa học máy tính tại MIT, người sử dụng kỹ thuật máy học để mã hóa dữ liệu cho biết, Numerai dường như đang sử dụng một phương pháp tương tự như Microsoft từng mô tả. Theo đó, dữ liệu sẽ được mã hóa nhưng không hoàn toàn theo cách bảo mật. “Bạn phải rất cẩn thận với những kênh phụ trên thuật toán mà bạn đang chạy.” Ông cho biết.

    Nhưng vẫn còn những nhóm khác đang làm việc trên những công nghệ tương tự để có thể giúp tạo ra các mô hình máy học tổng quát hơn từ dữ liệu mã hóa, như các nhà nghiên cứu tại Microsoft. Các nghiên cứu này có thể giúp những công ty như Microsoft bảo vệ tốt hơn thông tin cá nhân mà họ thu thập từ người dùng.

    Oren Etzioni, CEO của Viện Allen về AI, cho biết cách tiếp cận này có thể đặc biệt hữu ích cho Apple, khi công ty đang đẩy mạnh vào máy học nhưng vẫn giữ quan điểm cứng rắn về bảo mật dữ liệu. Vì vậy, những hãng công nghệ như vậy lớn trên có thể dẫn dắt loại AI từ đóng góp của cộng đồng mà Craib đang hướng tới.

    Mô hình hấp dẫn các nhà khoa học dữ liệu

    Dù thế nào đi nữa, Numerai đang gia tăng nỗ lực của mình. Ba tháng trước, có khoảng 4.500 nhà khoa học dữ liệu tham gia xây dựng khoảng 250.000 mô hình máy học để tạo ra khoảng 7 tỷ dự đoán cho quỹ này. Giờ với khoảng 7.500 nhà khoa học dữ liệu, họ đang xây dựng tổng cộng khoảng 500.000 mô hình để đưa ra khoảng 28 tỷ dự đoán.

    Với Kaggle, một sàn giao dịch cho cộng đồng các nhà khoa học dữ liệu, họ có thể cạnh tranh nhau để xây dựng được mô hình tốt nhất, và họ có thể kiếm tiền từ quá trình đó. Đối với Numerai, một phần của thuật toán đã được hoàn thành ở cấp độ cao. Thông qua các kỹ thuật thống kê và máy học được gọi là xếp chồng và tập hợp, Numerai có thể kết hợp những thuật toán vô hạn tốt nhất để tạo ra một mô hình tổng thể mạnh mẽ hơn.

    Cho dù phần lớn các nhà khoa học dữ liệu đó đều ẩn danh, một nhóm nhỏ trong số họ thì không, trong đó có Philip Culliton, đến từ Buffalo, New York, người cũng đang làm việc cho một công ty phân tích dữ liệu có tên Multimodel Research, từng nhận được trợ cấp từ Quỹ Khoa học Quốc gia. Anh đã dành nhiều năm cạnh tranh trong lĩnh vực khoa học dữ liệu trên Kaggle và xem Numerai như một lựa chọn hấp dẫn hơn.

    Kaggle rất thú vị và tôi thích cạnh tranh, nhưng chỉ một vài người cạnh tranh hàng đầu được trả tiền, và cũng chỉ trong một số cuộc thi.” Ông cho biết. “Quỹ của Numerai khá ổn khi nó được phân bổ cho khoảng 100 người đứng đầu hoặc giữa những người cạnh tranh với nhau, một số lượng khá lớn so với những người đứng đầu bảng xếp hạng.”

    Mỗi tuần, một trăm nhà khoa học sẽ nhận được bitcoin mỗi người, và cho đến nay công ty đã chi trả hơn 150.000 USD bằng tiền kỹ thuật số. Craib cho biết, nếu quỹ quản lý đến số tiền một tỷ USD, họ sẽ chi trả khoảng hơn 1 triệu USD mỗi tháng cho các nhà khoa học dữ liệu.

    Với quy mô hiện tại, Numerai vẫn còn một chặng đường dài phía trước cho đến khi họ đạt tới mốc trên, và hãy còn quá sớm để nói điều gì sẽ đến. Nhưng rõ ràng sự xuất hiện của Numerai đang hấp dẫn các nhà nghiên cứu dữ liệu, và trong khi startup này mới chỉ hạn chế trong phạm vi của ngành công nghiệp tài chính, nó có thể là tiền đề cho những lĩnh vực khác học tập theo mô hình này.

    Theo Wired

    Tin cùng chuyên mục
    Xem theo ngày

    NỔI BẬT TRANG CHỦ