Chia sẻ tại tại tọa đàm trực tuyến "Ngân hàng thời AI: Chống lừa đảo như thế nào?" do Báo Thanh Niên tổ chức sáng 29.5, TS Trần Mai Vũ, giảng viên Khoa Công nghệ thông tin, Trường đại học Công nghệ, Đại học Quốc gia Hà Nội, đã nêu ra một số thách thức với ngân hàng khi ứng dụng AI để chống gian lận tài chính.

TS Trần Mai Vũ (bìa trái) tham gia tọa đàm "Ngân hàng thời AI: Chống lừa đảo như thế nào?" do Báo Thanh Niên tổ chức sáng 29.5
ẢNH: TUẤN MINH
Nhờ AI, phát hiện gian lận trong chuyển tiền
Theo TS Trần Mai Vũ, một trong những ứng dụng của AI là phòng chống một số hoạt động liên quan tới gian lận trong lĩnh vực tài chính, ngân hàng. AI được huấn luyện trên một lượng dữ liệu lớn, có thể đi sâu vào những hoạt động vi mô để giúp chúng ta phát hiện ra những bất thường.
Một trường hợp kinh điển ứng dụng AI phát hiện gian lận là vụ Hồ sơ Panama (một vụ chuyển tiền xuyên biên giới). Công ty Palantir, một doanh nghiệp về startup khá nổi tiếng đã dùng công nghệ phân tích trên đồ thị, từ đó phát hiện những hội nhóm chuyển tiền ngầm. Từ Hồ sơ Panama, rất nhiều người nổi tiếng trên thế giới bị phát hiện liên quan tới những vụ giao dịch tài chính đáng ngờ.

Theo TS Trần Mai Vũ, nhờ huấn luyện trên dữ liệu lớn nên AI giúp chúng ta dễ phát hiện những bất thường
ẢNH: TUẤN MINH
Palantir đã giúp rất nhiều cho các tổ chức trên thế giới trong việc phân tích, phòng chống rửa tiền, phân tích những gian lận bất thường nhờ AI.
Tuy nhiên, ngoài ứng dụng hữu ích và các ưu điểm của AI mà nhiều người đã biết, giới chuyên môn cũng đã sớm nhận thấy AI có nhiều nhược điểm. Chẳng hạn, AI có thiên hướng bắt nhầm nếu như dữ liệu có vấn đề sai khác. Hoặc AI khó đáp ứng "tính giải thích được", trong khi đây là một nguyên tắc cơ bản trong lĩnh vực ngân hàng.
"AI như một "hộp đen", chúng ta không giải thích được, không biết nó chạy như thế nào, các mô hình - tham số đang hoạt động ra sao. Khách hàng không biết ngân hàng có thu thập dữ liệu của chúng ta hay không, rồi liệu người ta hack được thông tin mà chúng ta đã điền vào…? Trong một quá trình "hộp đen" như thế thì việc ứng dụng AI như thế nào ở cấp độ quốc gia, ở lĩnh vực ngân hàng là vấn đề rất quan trọng", TS Trần Mai Vũ nói.
Mặt khác, AI là nói đến dữ liệu, nhưng dữ liệu vừa phân mảnh vừa cát cứ ở các tổ chức, bởi nó là tài nguyên. Điều may mắn là trong khoảng 3 năm gần đây Chính phủ rất quan tâm trong việc tạo hành lang pháp lý an toàn trong việc chia sẻ dữ liệu, cho hệ thống dữ liệu tập trung (dữ liệu về dân cư, dữ liệu về đất đai…).
Hệ thống dữ liệu về ngân hàng đang được hoàn thiện, mục tiêu là cung cấp dữ liệu dưới một hình thức nào đó để cho các doanh nghiệp được sử dụng.
Làm sao để đảm bảo quyền riêng tư?
Trước băn khoăn của Báo Thanh Niên, để xử lý vấn đề dữ liệu bị phân mảnh thì các nhà khoa học làm gì để đảm bảo quyền riêng tư cho khách hàng, TS Trần Mai Vũ cho biết đây cũng là vấn đề được cộng đồng thế giới về dữ liệu và AI nói rất nhiều.
Bấy lâu nay, các thầy cô ở khoa Công nghệ thông tin, Trường đại học Công nghệ, Đại học Quốc gia Hà Nội đã và đang tham gia vào quá trình huấn luyện cho hệ thống AI của khá nhiều ngân hàng. Trong quá trình đó, các nhà chuyên môn phải giải quyết bài toán làm sao để huấn luyện mô hình AI mà vẫn bảo đảm quyền riêng tư.

TS Trần Mai Vũ: Các nhà chuyên môn phải giải quyết bài toán làm sao để huấn luyện mô hình AI mà vẫn bảo đảm quyền riêng tư
ẢNH: TUẤN MINH
Một trong những nhóm kỹ thuật hay được sử dụng là mỗi tổ chức tạo ra một mô hình để huấn luyện trên dữ liệu của mình nhằm kết hợp được nhiều nguồn dữ liệu mà không bị lộ lọt thông tin. Trong AI có một số mô hình gọi là Open weights, nghĩa là mô hình mở trọng số.
Nghĩa là các ngân hàng không cung cấp dữ liệu thô, chỉ gửi mô hình học (model weights). Các mô hình con sẽ được cập nhật và tổng hợp về mô hình trung tâm, điều này đảm bảo quyền riêng tư và tuân thủ pháp luật.
Chẳng hạn như Deepseek (doanh nghiệp khởi nghiệp AI của Trung Quốc - PV), họ không cung cấp dữ liệu cho thế giới dùng. Người dùng không biết dữ liệu đó chạy trên những dữ liệu gì mà chỉ biết mô hình đó chạy rất tốt.
"Vậy thì các tổ chức, các ngân hàng có thể xây dựng một mô hình mở về tham số, rồi chuyển giao cho các đơn vị khác để huấn luyện tiếp. Chất lượng mô hình cũng sẽ dần dần tốt lên. Đó là phương án thứ nhất.
Phương án thứ 2, chúng tôi thường gọi là làm mờ hoặc là xóa nhiễu. Nghĩa là khi đưa dữ liệu chúng ta cố gắng xóa những yếu tố cá nhân để dữ liệu khi chạy trong hệ thống AI thì không còn dấu vết cá nhân hoặc lộ lọt thông tin cá nhân mà luật quy định", TS Trần Mai Vũ nói.