Có một cám dỗ thường gặp khi xây bất cứ hệ thống tự động nào: "đã tự động thì cho nó tự động hoàn toàn cho khoẻ". Tôi từng tin vậy, và đã đổi ý.
Ở phần lớn các trường hợp tôi từng làm, bán-tự-động đánh bại full-auto — ít nhất trong giai đoạn đầu, có khi vĩnh viễn. Bài này là vài lý do tôi tin vậy.
Sai nhanh là điều tệ nhất
Khi một hệ thống tự động sai, nó sai với tốc độ máy. Một lỗi nhỏ trong logic — đảo dấu một biến, sai một ngưỡng — có thể nhân lên thành hàng chục hậu quả trước khi bạn kịp nhận ra.
Một con người ở giữa, làm một việc nhỏ — bấm xác nhận, duyệt tay, OK một lệnh — tạo ra một loại circuit breaker:
- Nếu hôm nay bạn nghi hệ thống lỗi, bạn không bấm. Nó dừng.
- Nếu hôm nay bạn không tỉnh táo, bạn cũng có thể chọn không bấm. Nó dừng.
- Nếu thế giới quanh hệ thống đổi (ví dụ thị trường có sự kiện bất thường), bạn nhận ra trước khi máy đổi.
Việc bấm tay chỉ tốn 5 giây. Cánh cửa nó tạo ra thì vô giá.
Bạn học được nhiều hơn khi ở trong vòng lặp
Ban đầu tôi nghĩ phải đứng ngoài hoàn toàn cho khách quan. Sau khi vận hành vài hệ thống bán-tự-động một thời gian, tôi nhận ra ngược lại: nhìn hệ thống ra quyết định mỗi ngày dạy bạn về domain hơn bất kỳ báo cáo nào.
Bạn thấy hệ thống ra một tín hiệu lạ vào sáng thứ Hai. Bạn ngồi lại 5 phút để hiểu vì sao. Bạn phát hiện một edge case không có trong test. Sửa. Lặp lại. Sau ba tháng, hiểu biết của bạn về domain sâu hơn người chỉ đọc dashboard cuối tháng — gấp nhiều lần.
Khi bạn bỏ con người ra khỏi vòng lặp, bạn cũng bỏ luôn cơ hội học.
Niềm tin là thứ đáng kiếm chậm
Tôi nghĩ với phần lớn user, niềm tin vào tự động hoá phải đến từ chứng kiến nó hoạt động — không phải từ một bài blog của founder hứa hẹn.
Pattern tôi thích:
- Giai đoạn 1 — Đề xuất. Hệ thống đề xuất, người dùng quyết định mọi lần.
- Giai đoạn 2 — Bán-tự-động. Hệ thống làm, người dùng confirm một lần định kỳ (mỗi ngày, mỗi phiên).
- Giai đoạn 3 — Tự động có guardrail. Hệ thống làm, có ngưỡng nguy hiểm tự pause để hỏi người.
- Giai đoạn 4 — Full-auto. Chỉ khi giai đoạn 3 chạy ổn nhiều tháng và bạn có hệ thống cảnh báo đủ tốt.
Phần lớn sản phẩm tôi thấy ở Việt Nam (và nhiều nơi khác) nhảy thẳng từ giai đoạn 1 sang giai đoạn 4 — bỏ qua quá trình kiếm niềm tin.
Pattern này áp dụng ở đâu
- AI agent đặt lệnh / gửi tin nhắn / thanh toán. Agent đề xuất, người confirm một click.
- OCR đọc hoá đơn. Đọc xong, user xác nhận trước khi lưu.
- Auto-categorize giao dịch ngân hàng. Gán nhãn tự động, nhưng để user override dễ dàng.
- Auto-reply email. Soạn nháp, user gửi.
Khi nào full-auto thắng
Cũng có lúc full-auto là đúng:
- Khối lượng quá lớn để con người ở giữa (search ranking, ad bidding).
- Quyết định cần phản xạ dưới 1 giây (high-frequency trading).
- Hậu quả của một quyết định sai đơn lẻ rất nhỏ (recommendation feed).
Ở các tình huống có tiền, có sức khoẻ, có quan hệ — hậu quả không nhỏ. Giữ con người ở giữa.
Move fast and break things — trừ khi things đó là cuộc đời ai đó.