Giỏ hàng

Những lao động thầm lặng đứng sau cơn sốt AI Trung Quốc


Trí tuệ nhân tạo thường được hình dung như câu chuyện của chip, mô hình lớn và kỹ sư hàng đầu. Nhưng tại Trung Quốc, một phần quan trọng của cỗ máy ấy đang được vận hành bởi lao động nông thôn: những người ngồi trong các phòng máy ở vùng sâu, dán nhãn hình ảnh, âm thanh và văn bản để dạy AI hiểu thế giới.
 
Những “giáo viên” thầm lặng của AI
 
Sau 9h sáng, một nhóm bà mẹ trẻ vừa đưa con đến trường mẫu giáo và tiểu học vội vã đến nơi làm việc. Trong phòng máy, họ gần như không có thời gian nghỉ trước khi đăng nhập vào hệ thống và tranh nhau nhận các nhiệm vụ mới: dán nhãn hình ảnh cho xe tự lái, do một tập đoàn công nghệ Trung Quốc vừa đăng lên.
 
Đó là phần chìm ít được nhìn thấy của ngành trí tuệ nhân tạo. AI không tự nhiên trở nên thông minh. Nó phải được “cho ăn” bằng dữ liệu, được luyện tập, được chỉnh sửa và được dạy từng chút một về thế giới con người. Đằng sau những mô hình hào nhoáng là vô số thao tác nhỏ: khoanh vùng người, xe, ổ gà trong ảnh; cắt đoạn ghi âm thành từng từ; đánh giá cuộc hội thoại là phù hợp hay lệch chuẩn.
 
Các lao động này đôi khi được truyền thông Trung Quốc gọi là “những người thầy huấn luyện AI”. Cách gọi ấy không sai, nhưng hơi lãng mạn. Chính xác hơn, họ đang làm công việc dịch thế giới thành thứ ngôn ngữ mà máy móc có thể tiêu hóa. Họ biến hình ảnh, âm thanh và văn bản thô thành dữ liệu huấn luyện để thuật toán học, sửa lỗi và cải thiện.
 
AI không chỉ sống trên mây
 
Trong tưởng tượng phổ biến, AI thuộc về các trung tâm dữ liệu khổng lồ, phòng thí nghiệm tinh vi và những kỹ sư lương cao. Nhưng ở Trung Quốc, nó còn nằm trong các thung lũng nội địa, trong những “trung tâm dán nhãn dữ liệu” đặt tại các khu tái định cư được lập ra từ các chương trình xóa đói giảm nghèo.
 
Công việc này có vẻ hiện đại, nhưng cách tổ chức lại giống dây chuyền nhà máy hơn là phòng thí nghiệm công nghệ cao. Mỗi tác vụ có đơn giá thấp. Nhịp làm việc dày đặc. Sai sót dẫn tới chỉnh sửa, trả lại, làm lại. Người lao động cần sự kiên nhẫn, bền bỉ và khả năng chịu áp lực, hơn là bằng cấp cao hay kiến thức kỹ thuật hiếm có.
 
Trên thế giới, lao động dữ liệu thường được nhắc đến như một phần của phân công lao động toàn cầu: kỹ sư và mô hình tập trung ở các nước giàu, việc dán nhãn được thuê ngoài tới nơi nhân công rẻ. Nhưng Trung Quốc có một biến thể riêng. Các hãng internet lớn không đơn giản chuyển việc này ra nước ngoài. Với các dự án nhạy cảm, họ lo ngại rò rỉ dữ liệu. Dữ liệu không chỉ là nhiên liệu huấn luyện AI; nó còn là bản đồ nghiên cứu và phát triển của doanh nghiệp.
 
Vì thế, nhiều công ty chọn mô hình “thuê trong nội địa”: đưa việc dán nhãn ra khỏi Bắc Kinh, Hàng Châu hay Thâm Quyến, chuyển tới các tỉnh và khu vực kém phát triển hơn như Sơn Tây, Thiểm Tây, Tân Cương, Quý Châu hay Hà Nam, nơi họ có thể sở hữu hoặc kiểm soát chặt các trung tâm dữ liệu.
 
Khi xóa nghèo gặp kinh tế số
 
Với các địa phương nghèo hơn, đây là cơ hội hiếm hoi để bước vào nền kinh tế AI. Họ không có nhiều kỹ sư hàng đầu, vốn mạo hiểm hay năng lực tính toán lớn. Nhưng họ có lao động. “Ngành dữ liệu” vì vậy trở thành lĩnh vực vừa tầm: cần nhiều người, ít rào cản kỹ thuật và có thể được ghi vào báo cáo như việc làm số, tăng trưởng công nghiệp và thành tích ổn định cộng đồng.
 
Điều này đặc biệt quan trọng ở những vùng mất dân. Trong các khu tái định cư được nghiên cứu, nhiều làng được di dời từ vùng núi xuống, gom lại trong các khu nhà mới. Người dân rời núi, nhưng đất cũ không còn. Kỹ năng cũ mất giá trị. Người trẻ rời đi. Người già và trẻ nhỏ ở lại. Nếu muốn cộng đồng thật sự ổn định, chính quyền phải tạo ra việc làm gần nhà, không nhất thiết lương cao, nhưng đều đặn.
 
Năm 2018, một cộng đồng như vậy bắt đầu đàm phán với công ty công nghệ lớn B-Tech. Địa phương cung cấp mặt bằng miễn phí 3 năm, sau đó trợ cấp; chịu trách nhiệm tiện ích và bảo trì mạng. Đổi lại, công ty hứa tạo việc làm và ưu tiên tuyển “phụ nữ có hoàn cảnh khó khăn”: ít học, trung niên, hoặc có trách nhiệm chăm sóc con cái.
 
Dưới góc nhìn phổ quát, đây là câu chuyện đôi bên cùng có lợi: công ty công nghệ có lực lượng lao động ổn định, địa phương có việc làm mới. Nhưng đào sâu hơn, sự ổn định ấy không hề nhẹ nhàng.
 
Dây chuyền dữ liệu và những cú sốc đơn hàng
 
Đơn hàng dán nhãn từ các tập đoàn công nghệ không đến đều. Có lúc dồn dập, có lúc cạn kiệt. Khi việc ít lại, thu nhập bấp bênh, người lao động rời đi. Khi đơn hàng quay lại, trung tâm phải tuyển mới, đào tạo, điều chỉnh lại. Chất lượng giảm, số lỗi và công việc phải làm tăng.
 
Chính quyền địa phương trở thành bộ giảm xóc cho nền tảng công nghệ. Khi thiếu đơn hàng, người lao động được đưa vào các khóa đào tạo của cơ quan việc làm, thực chất là những buổi luyện dán nhãn cơ bản. Ai đến và ký tên được nhận trợ cấp 50 NDT mỗi ngày. Khi đơn hàng giảm mạnh hơn, các trung tâm tìm thêm trợ cấp từ chương trình xóa đói giảm nghèo, giúp một số lao động nhận hỗ trợ tới 500 NDT. Trên giấy tờ, đó là hỗ trợ việc làm. Trong thực tế, nó giữ người lao động ở trạng thái sẵn sàng, giảm ý định bỏ việc và bảo toàn lực lượng cho đợt đơn hàng tiếp theo.
 
Quản lý hằng ngày cũng dựa nhiều vào hiểu biết địa phương. Người quản lý biết ai phải đón con lúc mấy giờ, ai đau mắt, ai có mẹ chồng nằm liệt giường, ai có thể làm muộn nhưng cuối tuần phải về làng. Khi cao điểm, lao động trẻ, khỏe, ít vướng việc nhà hơn được giao nhóm năng suất cao; các bà mẹ nhiều trách nhiệm gia đình thường nhận việc đơn giản hơn.
 
Điều trớ trêu là sự quản lý dựa trên quan hệ và kinh nghiệm này đôi khi hiệu quả hơn thuật toán. Một quản lý dự án dữ liệu AI thừa nhận công ty từng nghĩ có thể dùng thuật toán để phân công lao động chính xác hơn. Nhưng việc đó đòi hỏi rất nhiều dữ liệu, năng lực tính toán và tiền bạc. Cuối cùng, họ nhận ra các quản lý địa phương, nhờ hiểu từng người lao động, phân việc rẻ và hiệu quả hơn. Tỷ lệ chính xác tại các trung tâm do công ty kiểm soát có thể đạt 97 – 98%.
 
Lao động bị che khuất
 
Câu chuyện AI thường được kể bằng ngôn ngữ của điện toán đám mây, mô hình lớn và tham số. Nhưng trong các thung lũng xa xôi của Trung Quốc, nó giống một dây chuyền sản xuất nằm sát mặt đất hơn. Mỗi cú nhấp chuột, mỗi phiếu sửa lỗi, mỗi lần vội vã rời phòng máy lúc 4h30 để đón con đều góp phần làm cỗ máy AI tiến lên.
 
Điều đó buộc ta nhìn lại huyền thoại về trí tuệ nhân tạo. “Trí tuệ” không chỉ thuộc về máy móc, kỹ sư hay phòng thí nghiệm. Nó còn được xây dựng dựa trên lao động lặp đi lặp lại của những người khó nhìn thấy nhất: phụ nữ nông thôn, người tái định cư, lao động ít lựa chọn, những người dạy AI hiểu thế giới trong khi chính họ gần như vắng mặt trong câu chuyện hào nhoáng về tương lai.
 
shared via sixthtone, 

Bình luận

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Bình luận của bạn sẽ được duyệt trước khi đăng lên