Thế giới

Triết gia phát triển AI: Bài toán đạo đức được đặt lên bàn cân

Kiều Thoan Thu • 30/06/2026 - 15:50

Làn sóng tuyển dụng triết gia phản ánh sự thay đổi trong ngành AI, khi không chỉ xây dựng hệ thống thông minh hơn mà còn phải xác định cách AI nên hành xử.

Các phòng thí nghiệm trí tuệ nhân tạo hàng đầu thế giới như OpenAI, Google DeepMind và Anthropic đang mở rộng tuyển dụng sang một nhóm nhân sự ít liên quan trực tiếp đến kỹ thuật truyền thống mà là triết gia, chuyên gia đạo đức và khoa học xã hội.

Các công ty phát triển AI đang ngày càng chú trọng các nguyên tắc đạo đức chứ không chỉ dựa trên dữ liệu đầu vào. Ảnh: Newo.ai

Theo nhiều phân tích từ The Economist, Wired, The Atlantic và các báo công nghệ quốc tế, xu hướng này phản ánh sự thay đổi rõ rệt trong cách phát triển AI, từ tập trung vào năng lực tính toán và xử lý dữ liệu sang những vấn đề về giá trị, hành vi và tác động xã hội của hệ thống trí tuệ nhân tạo.

Trọng tâm của sự thay đổi này nằm ở việc đảm bảo hệ thống AI vận hành phù hợp với giá trị và kỳ vọng của con người, hay nói cách khác là tập trung vào việc bảo đảm AI "hành xử đúng", thay vì chỉ "trả lời đúng".

Các nhóm phát triển AI hiện tập trung nhiều hơn vào những câu hỏi như AI nên phản ứng thế nào trong các tình huống xung đột đạo đức, nên ưu tiên an toàn hay hiệu quả, và làm thế nào để hạn chế hành vi gây hại trong những bối cảnh chưa từng xuất hiện trong dữ liệu huấn luyện, bên cạnh việc tối ưu hiệu quả của ứng dụng.

Vì thế, một số mô hình được phát triển theo hướng “hiến pháp AI”, tức hệ thống được điều chỉnh bởi một tập hợp nguyên tắc về đạo đức và an toàn, thay vì chỉ dựa vào dữ liệu đầu vào.

Chính sự chuyển dịch này khiến triết gia, đặc biệt là những người có nền tảng về logic, đạo đức học và triết học chính trị, trở thành một phần trong quá trình thiết kế và đánh giá hệ thống AI.

Triết gia bước vào phòng thí nghiệm công nghệ

Theo các báo cáo từ The Economist và NDTV, nhiều công ty AI không chỉ dừng ở việc mời triết gia làm cố vấn, mà cho họ tham gia trực tiếp vào các nhóm phát triển cốt lõi, đặc biệt trong các mảng như an toàn mô hình, hành vi hệ thống và đánh giá rủi ro.

Công việc của họ không mang tính học thuật thuần túy mà gắn trực tiếp với sản phẩm, giúp xây dựng nguyên tắc phản hồi, phân tích tình huống nhạy cảm và hỗ trợ thiết kế cách AI xử lý các câu hỏi liên quan đến đạo đức hoặc xung đột lợi ích.

Theo một số nghiên cứu quốc tế, việc thiết kế AI hiện nay chịu ảnh hưởng của hai hướng tư duy trong triết học. Một hướng cho rằng AI cần tuân thủ những nguyên tắc bất di bất dịch, như không gây hại hay không lừa dối, trong khi hướng còn lại cho rằng nên đánh giá một quyết định dựa trên kết quả nó mang lại.

Những khác biệt trong tư duy này không còn là câu chuyện của giới nghiên cứu, mà đang được phản ánh trực tiếp vào cách các hệ thống AI đưa ra phản hồi và xử lý những tình huống phức tạp.

Việc các phòng thí nghiệm AI tuyển dụng triết gia cũng làm dấy lên nhiều tranh luận. Một số chuyên gia cho rằng đây là bước đi tất yếu, bởi khi AI ngày càng ảnh hưởng đến đời sống, việc xây dựng hệ thống không thể chỉ dựa vào năng lực công nghệ mà còn cần có những nguyên tắc rõ ràng về đạo đức và giá trị.

Tuy nhiên, cũng có ý kiến cho rằng sự xuất hiện của chuyên gia đạo đức có thể chỉ mang tính hình thức nếu những quyết định quan trọng vẫn chủ yếu bị chi phối bởi mục tiêu thương mại và sức ép cạnh tranh giữa các công ty công nghệ.

Bên cạnh triết gia, nhiều doanh nghiệp AI lớn cũng đang tuyển thêm chuyên gia về tâm lý học, khoa học hành vi và chính sách công. Xu hướng này cho thấy phát triển AI đòi hỏi sự tham gia của nhiều lĩnh vực để giải quyết đồng thời các bài toán về công nghệ, con người và xã hội.

Theo các phân tích quốc tế, cuộc cạnh tranh giữa các công ty AI tập trung vào khả năng bảo đảm hệ thống hoạt động an toàn, đáng tin cậy và tạo được niềm tin từ người dùng.