Độ nhiễu: làm thế nào để vượt qua chi phí cao và ẩn của sự thiếu nhất quán trong việc ra quyết định

do-nhieu-lam-the-nao-de-vuot-qua-chi-phi-cao-va-an-cua-su-thieu-nhat-quan-trong-viec-ra-quyet-dinh

Bài viết dưới đây được dịch từ bài báo đăng trên tờ Harvard Business Review vào năm 2016. Có lẽ đây chính là tiền đề và ý tưởng ban đầu để GS Daniel Kahneman (cùng với các tác giả khác) viết cuốn Độ Nhiễu.

Hồi đọc xong quyển Noise: A Flaw in Human Judgement mình cứ thắc mắc mãi tại sao nó vẫn chưa được xuất bản ở Việt Nam dù có rất nhiều người thích sách của cụ Daniel Kahneman, thì nay NXB Trẻ đã phát hành em nó trong tháng 3 với tên gọi Độ Nhiễu: Sai Lầm Trong Phán Đoán. Cuốn sách như chính tên gọi của nó nói về những ‘lỗi’ trong quá trình phán đoán dẫn đến sự thiếu nhất quán trong các quyết định của các cá nhân và tổ chức (từ làm báo giá, thẩm định vốn, chẩn đoán bệnh, xử án, v.v) và hệ quả không hề nhỏ là những chi phí ẩn mà các tổ chức phải gánh chịu. Cuốn sách khá thú vị bởi chủ đề mà nó đề cập, tuy nhiên vì là sách khoa học thuần túy nên sẽ có những phần khá khô khan dù đã được lồng ghép rất nhiều ví dụ. Theo mình nghĩ đối tượng được hưởng lợi nhiều nhất từ cuốn này là các nhà quản lý.

Bài viết dưới đây được dịch từ bài báo đăng trên tờ Harvard Business Review vào năm 2016. Có lẽ đây chính là tiền đề và ý tưởng ban đầu để GS Daniel Kahneman (cùng với các tác giả khác) viết cuốn Độ Nhiễu. Vì là chuyên trang về kinh tế, nên bài viết chỉ tập trung vào khía cạnh độ nhiễu trong kinh doanh. Để biết thêm về vấn đề độ nhiễu trong các lĩnh vực khác của đời sống, xin mời bạn … đọc sách.

Nguồn: https://hbr.org/2016/10/noise

Tác giả: Daniel Kahneman, Andrew M. Rosenfield, Linnea Gandhi, Tom Blaser

Bài được đăng trên tạp chí Havard Business Reviewers (ấn bản tháng 10/2016)

Image: Gonny Gong 

Tóm tắt. Các tổ chức luôn mong đợi sự nhất quán trong quyết định của các nhân viên, nhưng con người vốn dĩ không đáng tin cậy. Sự phán đoán của người này có thể rất khác biệt so với người kia, ngay cả khi những con người đó ở cùng một vị trí công tác và được cho là cùng tuân theo một nguyên tắc chủ đạo. Và những yếu tố không liên quan, như tâm trạng và thời tiết, có thể khiến quyết định của một người thay đổi theo từng thời điểm. Khả năng biến thiên này của các quyết định được gọi là độ nhiễu (noise), và nó gây tốn kém một cách đáng kinh ngạc cho các doanh nghiệp, và là điều mà các doanh nghiệp thường không nhận thức được.

Người đoạt giải Nobel Daniel Kahneman, một giáo sư tâm lý học của trường Princeton, Andrew M. Rosenfield, Linnea Gandhi, và Tom Blaser của TGG Group giải thích rằng các tổ chức có thể kiểm tra độ nhiễu (noise audit) bằng cách cho một nhóm chuyên gia đánh giá các sự vụ phổ biến. Mức độ khác biệt trong đánh giá sẽ cung cấp thước đo về độ nhiễu. Nếu vấn đề nghiêm trọng, các doanh nghiệp có thể thực hiện một số biện pháp khắc phục. Phương pháp triệt để nhất là thay thế sự phán đoán của con người bằng thuật toán. Không giống như con người, các thuật toán luôn trả về cùng một đầu ra cho bất kỳ đầu vào cụ thể nào, và nghiên cứu cho thấy những dự đoán và quyết định của chúng thường chính xác hơn so với những gì được thực hiện bởi chuyên gia.

Mặc dù các thuật toán có vẻ khó xây dựng, các tác giả đã miêu tả cách để thiết lập chúng với dữ liệu đầu vào được lấy từ một số ít trường hợp và một vài nguyên tắc thông thường đơn giản. Nhưng nếu việc áp dụng các công thức là không khả thi về mặt chính sách hoặc hoạt động, các doanh nghiệp vẫn có thể thiết lập các quy trình và thông lệ để hướng dẫn nhân viên đưa ra những quyết định nhất quán hơn.

Trong một doanh nghiệp dịch vụ tài chính toàn cầu hợp tác cùng chúng tôi, một khách hàng lâu năm đã chẳng may nộp cùng một hồ sơ tại hai chi nhánh. Mặc dù những nhân viên thẩm định hồ sơ được cho là đã tuân theo các quy tắc giống nhau – và do đó sẽ đưa ra kết quả như nhau – hai văn phòng này lại trả về các báo giá vô cùng khác biệt. Quá sửng sốt trước kết quả này, khách hàng đã trao cơ hội kinh doanh cho đối thủ cạnh tranh của họ. Từ góc nhìn của doanh nghiệp, lẽ ra các nhân viên ở cùng một vị trí có thể thay thế được cho nhau, nhưng trong trường hợp này thì không. Thật không may, đây lại là một vấn đề vô cùng phổ biến.

Trong nhiều tổ chức, các chuyên gia thường được chỉ định công việc một cách tùy tiện: chuyên viên thẩm định trong các tổ chức xếp hạng tín dụng, bác sĩ trong các phòng cấp cứu, chuyên viên bảo hiểm và tín dụng, và cả những vị trí khác. Các tổ chức kỳ vọng vào sự nhất quán ở những chuyên gia này: Các trường hợp giống nhau nên được xử lý tương tự, nếu không muốn nói là y hệt nhau. Vấn đề nằm ở chỗ con người là những người ra quyết định không đáng tin cậy; sự phán đoán của họ bị ảnh hưởng mạnh mẽ bởi các yếu tố chẳng hề liên quan, ví dụ như tâm trạng hiện tại của họ, thời điểm dùng bữa gần nhất, và thời tiết. Chúng tôi gọi khả năng biến thiên của các phán đoán là độ nhiễu. Đây là một loại thuế vô hình đối với kết quả kinh doanh sau thuế của nhiều công ty.   

Một số công việc không có độ nhiễu. Giao dịch viên tại ngân hàng hay bưu điện tuy thực hiện những nhiệm vụ phức tạp, nhưng họ phải tuân thủ những quy tắc nghiêm ngặt làm hạn chế sự đánh giá chủ quan và nhằm đảm bảo rằng những trường hợp giống nhau sẽ được xử lý ý hệt như nhau. Ngược lại, các chuyên gia y tế, chuyên viên tín dụng, quản lý dự án, thẩm phán, và giám đốc đều thực hiện việc ra quyết định dựa trên trải nghiệm cá nhân và các quy tắc chung chung thay vì các quy tắc cứng nhắc. Và nếu như họ không đưa ra câu trả lời y hệt như những người ở cùng vị trí với mình, thì đây là điều có thể chấp nhận được; đó cũng là điều mà chúng tôi muốn ám chỉ khi gọi một quyết định là “vấn đề của sự phán đoán.” Không thể kỳ vọng vào việc các quyết định không hề có độ nhiễu ở những doanh nghiệp có nhân viên thực thi nghiệp vụ đánh giá. Nhưng thường thì, độ nhiễu lại vượt xa hơn nhiều so với mức độ mà các lãnh đạo công ty có thể coi là chấp nhận được – và vấn đề này cũng hoàn toàn nằm ngoài nhận thức của họ.

Sự phổ biến của độ nhiễu đã được chứng minh trong một số nghiên cứu. Các nhà nghiên cứu học thuật đã nhiều lần khẳng định rằng các chuyên gia thường tự mâu thuẫn với những phán đoán trước đó của mình khi họ được cung cấp cũng cùng dữ liệu ấy vào một thời điểm khác. Chẳng hạn, khi các nhà phát triển phần mềm được hỏi vào hai ngày khác nhau về thời gian dự kiến hoàn thành công việc, trung bình số giờ họ dự kiến sẽ khác nhau đến 71%. Khi nhà bệnh lý học thực hiện hai đánh giá về mức độ nghiêm trọng của kết quả sinh thiết, sự tương quan giữa các đánh giá của họ chỉ có 0,61 (so với mức hoàn hảo là 1,0), cho thấy rằng họ đưa ra chẩn đoán thiếu nhất quán khá thường xuyên. Đánh giá của những người khác nhau thậm chí còn có khả năng phân kỳ hơn nữa. Nghiên cứu đã xác nhận rằng trong nhiều nhiệm vụ, quyết định của các chuyên gia rất khác nhau: định giá cổ phiếu, định giá bất động sản, kết án tội phạm, đánh giá hiệu quả công việc, kiểm toán các báo cáo tài chính, v.v Kết luận tất yếu là các chuyên gia thường đưa ra quyết định khác biệt đáng kể so với các đồng nghiệp của mình, so với các quyết định trước đó của bản thân, và so với những nguyên tắc mà họ tuyên bố tuân theo.

Độ nhiễu thường có tính xảo quyệt: Nó khiến cho ngay cả những doanh nghiệp thành công cũng mất đi một số tiền đáng kể mà không nhận ra. Lớn như thế nào ư? Để ước tính, chúng tôi đã yêu cầu các giám đốc điều hành của một trong số những tổ chức mà chúng tôi tiến hành nghiên cứu như sau: “Giả sử mức đánh giá tối ưu của một thương vụ là $100.000. Nếu chuyên viên phụ trách thương vụ đó định mức giá trị là $115.000 thì chi phí mà tổ chức này phải chịu là bao nhiêu? Chi phí sẽ là bao nhiêu nếu vị chuyên gia đó đưa ra con số $85.000?” Chi phí ước tính khá là cao. Khi tổng kết lại các đánh giá được thực hiện hàng năm, chi phí của độ nhiễu có thể đến con số hàng tỷ dollar – một con số không thể chấp nhận được ngay cả với một tập đoàn đa quốc gia. Giá trị của việc giảm thiểu độ nhiễu dù chỉ là vài điểm phần trăm sẽ là hàng chục triệu dollar. Điều đáng chú ý là, cho tới thời điểm đó, tổ chức đã hoàn toàn bỏ qua câu hỏi về sự nhất quán.

Từ lâu, người ta đã biết rằng những dự đoán và quyết định được thực hiện bởi các thuật toán thống kê đơn giản thường chính xác hơn so với khi được thực hiện bởi các chuyên gia, ngay cả khi chuyên gia được tiếp cận nhiều thông tin hơn so với những gì mà các công thức sử dụng làm đầu vào. Chỉ là, không mấy ai biết rằng lợi thế chủ yếu của các thuật toán nằm ở chỗ chúng không có độ nhiễu: Không giống như con người, một công thức tính toán sẽ luôn trả về cùng một đầu ra cho bất kỳ đầu vào nào. Sự nhất quán vượt trội này cho phép ngay cả những thuật toán đơn giản và không hoàn hảo cũng có thể đạt đến độ chính xác cao hơn so với các chuyên gia loài người. (Dĩ nhiên, có những lúc các thuật toán sẽ không khả thi về mặt vận hành hoặc chính sách, như chúng ta sẽ đề cập đến).

Trong khuôn khổ bài viết này, chúng tôi sẽ diễn giải sự khác biệt giữa độ nhiễu và độ chệch, đồng thời xem xét cách các nhà điều hành có thể kiểm tra mức độ và tác động của độ nhiễu trong tổ chức của mình. Sau đó, chúng tôi sẽ trình bày một phương pháp ít tốn kém, ít được sử dụng để xây dựng các thuật toán nhằm khắc phục độ nhiễu, và chúng tôi sẽ phác thảo các quy trình có thể nâng cao sự nhất quán khi các thuật toán không phải là một lựa chọn.

Độ nhiễu (noise) và Độ chệch (bias)

Khi mọi người xem xét các sai sót trong việc phán đoán và ra quyết định, họ hầu như đều nghĩ đến các thiên kiến xã hội như là thiên kiến rập khuôn về thiểu số hoặc nhận thức, chẳng hạn như việc quá tự tin và lạc quan một cách vô căn cứ. Sự biến thiên vô ích mà chúng ta gọi là độ nhiễu là một loại sai sót khác. Để hiểu đúng về sự khác biệt này, bạn có thể nghĩ đến chiếc cân đặt trong phòng tắm nhà mình. Ta sẽ nói rằng cái cân bị chệch nếu số ghi trên đó nói chung quá cao hoặc quá thấp. Nếu cân nặng của bạn phụ thuộc vào vị trí mà bạn đặt chân trên chiếc cân, thì chiếc cân này có độ nhiễu. Một chiếc cân báo số cân dưới cân nặng thật bốn pound một cách nhất quán thì bị chệch nghiêm trọng nhưng không có độ nhiễu. Chiếc cân đưa ra số ghi khác nhau trong hai lần bạn bước lên cân thì có độ nhiễu. Rất nhiều lỗi đo lường phát sinh từ sự kết hợp giữa độ chệch và độ nhiễu. Hầu hết những cái cân sức khỏe rẻ tiền đều hơi bị ‘chệch’ và khá ‘nhiễu’.

Để minh họa trực quan về sự khác biệt giữa độ chệch và độ nhiễu, ta hãy xem xét ví dụ về các tấm bia tập bắn trong cuộc triển lãm mang tên “Độ Nhiễu Và Đô Chệch Ảnh Hưởng Đến Sự Chính Xác Như Thế Nào.” Chúng cho thấy các kết quả tập bắn của các nhóm bốn người mà tại đó mỗi người sẽ bắn một viên đạn.

  • Nhóm A là chính xác: Các viên đạn của các thành viên trong nhóm nằm trong hồng tâm và gần với nhau.

Ba đội khác bắn không chính xác nhưng theo những cách khác nhau:

  • Đội B có độ nhiễu: Các viên đạn của các thành viên tập trung xung quanh hồng tông nhưng nằm rải rác khắp nơi.
  • Nhóm C có độ chệch: Các viên đạn đều lệch hồng tâm nhưng tập trung lại với nhau.
  • Nhóm D vừa có độ nhiễu lại vừa có độ chệch.

Như minh họa so sánh giữa đội A với đội B cho thấy, khi không có sự sai lệch, sự gia tăng của độ nhiễu luôn làm giảm độ chính xác. Khi độ chệch xuất hiện, sự tăng độ nhiễu có thể thực sự dẫn đến một cú trúng đích may mắn, như những gì xảy ra với đội D. Dĩ nhiên, không có tổ chức nào lại đặt niềm tin vào may rủi cả. Độ nhiễu luôn là điều không mong muốn – và đôi khi là cả một thảm họa.

Sẽ thật hữu ích khi một tổ chức biết về độ chệch và độ nhiễu trong các quyết định của nhân viên, tuy nhiên việc thu thập thông tin lại không hề đơn giản. Các vấn đề khác nhau sẽ phát sinh trong quá trình đo lường những sai sót này. Một vấn đề lớn là người ta chỉ biết đến kết quả của các quyết định ở một tương lai xa, nếu có. Ví dụ, các chuyên viên tín dụng thường phải đợi đến vài năm mới biết được khoản vay mà họ phê duyệt có hiệu quả hay không, và họ gần như không bao giờ biết điều gì sẽ xảy ra với một hồ sơ mà họ từ chối.

Ở đâu có phán đoán, ở đó có độ nhiễu – và

thường là nhiều hơn so với những gì bạn nghĩ.

Không giống như độ chệch, độ nhiễu có thể được đo lường mà không cần phải biết về câu trả lời chính xác. Để minh họa cho điều này, ta hãy thử tưởng tượng rằng các vòng tròn trên bia tập bắn đã bị xóa đi. Bạn khi ấy không biết gì về tổng thể độ chính xác của cả đội, nhưng bạn có thể chắc chắn rằng có gì đó không ổn trong những vết đạn nằm rải rác trên bia tập bắn của đội B và D: Dù hồng tâm có ở đâu, không phải tất cả những vết đạn ấy đều nằm gần nó. Tất cả những gì cần thiết để đo lường độ nhiễu trong các đánh giá là một thử nghiệm đơn giản mà tại đó một số trường hợp thực tế được đánh giá độc lập bởi vài chuyên gia. Ở đây, lại một lần nữa, có thể quan sát thấy sự phân kỳ của các phán đoán mà không cần phải biết tới câu trả lời chính xác. Chúng tôi gọi những thử nghiệm như thế là kiểm tra độ nhiễu.

Tiến hành Kiểm tra Độ nhiễu

Mục đích của việc kiểm tra độ nhiễu không phải là để lập báo cáo hay biên bản. Mục tiêu cuối cùng là nhằm nâng cao chất lượng của các quyết định, và một cuộc kiểm tra chỉ thành công khi các lãnh đạo của đơn vị sẵn sàng chấp nhận những kết quả không mấy dễ chịu và hành động dựa trên chúng. Một sự chấp thuận như vậy sẽ dễ dàng đạt được hơn nếu ban giám đốc coi thử nghiệm này là sản phẩm của chính họ. Để đạt được mục đích đó, các sự vụ cần phải được tổng hợp bởi các thành viên có uy tín trong nhóm và nên bao quát toàn bộ các vấn đề thường gặp. Để các kết quả này có thể phù hợp với mọi người, toàn bộ thành viên trong nhóm nên tham gia vào công tác kiểm tra. Một nhà khoa học xã hội có kinh nghiệm trong việc thực hiện những thí nghiệm nghiêm ngặt về hành vi nên giám sát các khía cạnh kỹ thuật của cuộc kiểm tra, nhưng đơn vị chuyên môn phải làm chủ quy trình này.

Gần đây, chúng tôi đã hỗ trợ hai tổ chức dịch vụ tài chính thực hiện việc kiểm tra độ nhiễu. Nhiệm vụ và chuyên môn của hai nhóm mà chúng tôi nghiên cứu khá là khác nhau, nhưng cả hai đều đòi hỏi sự đánh giá các tài liệu ở mức độ phức tạp vừa phải và thường liên quan tới những quyết định trị giá hàng trăm ngàn dollar. Chúng tôi đã tuân theo cùng một quy trình ở cả hai tổ chức. Đầu tiên, chúng tôi đề nghị các quản lý của nhóm chuyên gia tham gia vào việc chuẩn bị một số hồ sơ thực tế để đánh giá. Để tránh việc thử nghiệm bị rò rỉ thông tin, toàn bộ hoạt động này được thực hiện trong cùng một ngày. Các nhân viên được yêu cầu dành ra nửa ngày để phân tích từ 2 – 4 hồ sơ. Họ phải quyết định giá trị dollar cho mỗi một hồ sơ, giống như điều mà họ vẫn thường làm. Để tránh thông đồng, những người tham gia không được thông báo cho biết thử nghiệm này liên quan đến độ tin cậy. Ví dụ, trong một tổ chức, các mục tiêu được miêu tả như là nhằm tìm hiểu suy nghĩ chuyên nghiệp của các nhân viên, cải thiện hiệu quả giao tiếp giữa đồng nghiệp với nhau. Khoảng 70% chuyên gia của tổ chức A đã tham gia, và con số của tổ chức B là 50%.

Chúng tôi đã xây dựng chỉ số độ nhiễu cho mỗi trường hợp, mỗi một chỉ số nhằm trả lời cho câu hỏi sau: “Đánh giá của hai nhân viên bất kỳ khác nhau bao nhiêu?” Chúng tôi biểu thị số tiền này dưới dạng phần trăm trung bình của chúng. Giả sử, kết quả đánh giá một hồ sơ của hai nhân viên lần lượt là $600 và $1.000. Đánh giá trung bình của họ khi ấy sẽ là $800, và chênh lệch của hai đánh giá là $400, vì thế chỉ số độ nhiễu là 50% cho cặp này. Chúng tôi đã thực hiện tính toán như vậy với tất cả các cặp nhân viên còn lại rồi tính chỉ số độ nhiễu trung bình cho mỗi hồ sơ.

Các cuộc phỏng vấn với các giám đốc của hai tổ chức trước cuộc kiểm tra cho thấy họ kỳ vọng mức chênh lệch trong quyết định của các chuyên viên sẽ rơi vào khoảng 5% đến 10% – một mức độ mà họ xem là chấp nhận được đối với “vấn đề phán đoán.” Kết quả đến với họ như một cú sốc. Với tổ chức A, chỉ số độ nhiễu dao động từ 34% cho đến 62% trên 6 hồ sơ, và tổng thể mức trung bình là 48%. Trong bốn hồ sơ của tổ chức B, chỉ số độ nhiễu dao động từ 46% đến 70%, với mức trung bình là 60%. Có lẽ, điều đáng thất vọng nhất chính là kinh nghiệm làm việc không đồng nghĩa với độ nhiễu thấp hơn. Trong số các chuyên gia có kinh nghiệm làm việc từ 5 năm trở lên, sự bất đồng trung bình là 46% ở tổ chức A và 62% ở tổ chức B.

Không một ai lường trước được điều này. Nhưng bởi vì họ là bên làm chủ thử nghiệm, các vị giám đốc ở cả hai tổ chức đều thừa nhận rằng phán đoán của các chuyên gia không đáng tin cậy đến mức không thể chấp nhận được. Tất cả đều nhanh chóng đồng ý rằng cần phải làm gì đó để kiểm soát vấn đề.

Bởi vì những phát hiện này phù hợp với nghiên cứu trước đó về mức độ tin cậy thấp của phán đoán chuyên môn, chúng không hề khiến chúng tôi ngạc nhiên. Với chúng tôi mà nói, nan đề chính nằm ở chỗ cả hai tổ chức chưa bao giờ coi độ tin cậy là một vấn đề.

Vấn đề về độ nhiễu là nó thực sự vô hình trong thế giới kinh doanh; chúng tôi thấy rằng những người chứng kiến thực nghiệm đã khá ngạc nhiên khi độ tin cậy của các phán đoán chuyên môn được đề cập đến như là một vấn đề. Điều gì đã ngăn các công ty khỏi việc nhận thấy rằng phán đoán của nhân viên là không chính xác? Câu trả lời nằm ở hai hiện tượng quen thuộc: Các chuyên gia có kinh nghiệm có khuynh hướng rất tự tin vào sự chính xác trong những đánh giá của mình, và họ cũng đánh giá cao trí thông minh của đồng nghiệp. Sự kết hợp này hiển nhiên dẫn đến việc đánh giá quá cao sự đồng nhất. Khi được hỏi về việc đồng nghiệp sẽ nói gì, các chuyên gia kỳ vọng phán đoán của mình và người khác giống nhau nhiều hơn so với thực tế. Dĩ nhiên, hầu như các chuyên gia giàu kinh nghiệm hoàn toàn không quan tâm đến ý kiến của người khác và chỉ đơn giản cho rằng mình có câu trả lời tốt nhất. Một lý do khiến cho vấn đề độ nhiễu trở nên vô hình là bởi vì con người thường không hình dung đến những khả năng hợp lí có thể xảy ra đối với mỗi phán đoán của mình.

Việc kỳ vọng rằng người khác sẽ đồng tình với bạn đôi khi là hợp lí, đặc biệt là khi các phán đoán có tính kinh nghiệm đến mức chúng trở thành trực giác. Thi đấu cờ vua đỉnh cao và lái xe là ví dụ điển hình về những việc được thực hành đến mức gần như hoàn hảo. Những kiện tướng cờ vua khi nhìn vào thế cờ trên bàn cờ đều sẽ có một đánh giá tương tự như nhau về tình trạng của ván cờ – chẳng hạn như, quân hậu trắng đang gặp nguy hiểm hay quân đen đang phòng thủ yếu. Điều này cũng đúng với những người lái xe. Hoạt động giao thông sẽ vô cùng nguy hiểm nếu như chúng ta không cho rằng những tài xế xung quanh mình có chung hiểu biết về thứ tự ưu tiên nơi giao lộ và bùng binh. Không hề tồn tại hoặc chỉ có rất ít độ nhiễu ở mức kỹ năng cao.

Kỹ năng cao trong môn cờ vua và lái xe được phát triển qua nhiều năm thực hành trong một môi trường có thể dự đoán được, tại đó theo sau các hành động luôn là sự phản hồi vừa rõ ràng vừa tức thì. Thật không may, chỉ rất ít ngành nghề mới hoạt động trong một thế giới như vậy. Trong phần lớn các nghề nghiệp, mọi người học cách đưa ra phán đoán thông qua việc lắng nghe lời giảng giải và phê bình từ cấp trên và đồng nghiệp – một nguồn tri thức kém tin cậy hơn nhiều so với việc học từ chính sai lầm của bản thân. Giàu kinh nghiệm trong một công việc luôn làm gia tăng sự tự tin của mọi người trước những phán đoán của mình, nhưng khi thiếu đi sự phản hồi tức thì, sự tự tin không hề đảm bảo cho tính chính xác hay tính thống nhất.

Chúng tôi đưa ra câu cách ngôn này như một lời tóm tắt: Ở đâu có phán đoán, ở đó có độ nhiễu – và thường là nhiều hơn so với những gì bạn nghĩ. Theo lệ thường, chúng tôi tin rằng cả những chuyên gia lẫn cấp trên của họ đều không thể đoán chính xác về độ tin cậy trong các phán đoán của mình. Cách duy nhất để có được đánh giá chính xác là tiến hành một cuộc kiểm tra độ nhiễu. Chí ít là trong một số trường hợp, vấn đề sẽ đủ nghiêm trọng đến mức cần phải hành động.

Giảm Thiểu Độ Nhiễu

Giải pháp triệt để nhất đối với vấn đề độ nhiễu là thay thế phán đoán của con người bằng những quy tắc chính thức – được biết đến như là thuật toán – sử dụng dữ liệu của một hồ sơ để đưa ra dự đoán hoặc quyết định. Con người đã cạnh tranh với các thuật toán trong hàng trăm cuộc tỉ thí về độ chính xác trong hơn 60 năm qua, trong các nhiệm vụ từ dự đoán tuổi thọ của bệnh nhân ung thư cho tới dự đoán khả năng thành công của các sinh viên tốt nghiệp chương trình sau đại học. Thuật toán chính xác hơn các chuyên gia con người trong khoảng một nửa số nghiên cứu, và gần như tương đương với con người trong những nghiên cứu còn lại. Sự tương đương này cũng được tính như là chiến thắng dành cho thuật toán, thứ vốn hiệu quả hơn về mặt chi phí.

Dĩ nhiên, trong nhiều tình huống, các thuật toán sẽ không thiết thực. Việc áp dụng một quy tắc có thể sẽ không khả thi khi các đầu vào có đặc tính riêng hoặc khó có thể mã hóa theo một định dạng nhất quán. Các thuật toán cũng ít có khả năng hữu dụng hơn trong những phán đoán và quyết định mang tính đa chiều hoặc phụ thuộc vào việc dàn xếp với một bên khác. Ngay cả khi đã có sẵn giải pháp thuật toán về mặt nguyên tắc, những cân nhắc về mặt tổ chức đôi khi lại ngăn cản việc triển khai. Sự thay thế các nhân viên hiện thời bằng phần mềm là một quá trình đầy khó khăn và sẽ vấp phải sự phản đối trừ khi nó giải phóng những nhân viên này cho những nhiệm vụ thú vị hơn.

Nhưng nếu có các điều kiện phù hợp, việc phát triển và triển khai thuật toán có thể sẽ dễ dàng một cách đáng ngạc nhiên. Giả định chung là các thuật toán đòi hỏi việc phân tích thống kê trên một lượng lớn dữ liệu. Ví dụ, hầu hết những người trao đổi với chúng tôi đều tin rằng dữ liệu của một nghìn hồ sơ vay vốn và kết quả của chúng là cần thiết để xây dựng một phương trình dự đoán khả năng vỡ nợ của các khoản vay thương mại. Chỉ có rất ít người mới biết rằng các thuật toán thích hợp có thể được xây dựng mà không cần tới bất kỳ dữ liệu đầu ra nào – và chỉ với thông tin đầu vào của một số lượng nhỏ hồ sơ. Chúng tôi gọi những công thức dự đoán được xây dựng mà không có dữ liệu kết quả là “ngyên tắc hợp lí” (reasoned rules), bởi vì chúng được dựa trên lý luận thông thường.

Việc xây dựng một nguyên tắc hợp lý bắt đầu từ việc lựa chọn một vài (có thể là từ sáu đến tám) biến số có liên quan rõ ràng đến kết quả được dự đoán. Chẳng hạn, nếu kết quả của khoản vay là vỡ nợ, tài sản và nợ phải trả chắc chắn sẽ được đưa vào danh sách. Bước tiếp theo là phân bổ những biến số này theo trọng số tương ứng trong công thức dự đoán, đặt dấu cho chúng theo hướng rõ ràng (dương với tài sản, âm với nợ phải trả). Sau đó, nguyên tắc có thể được xây dựng bởi một vài phép tính đơn giản.

Kết quả đáng ngạc nhiên của nhiều nghiên cứu là trong nhiều bối cảnh, nguyên tắc hợp lý gần như chính xác giống các mô hình thống kê được xây dựng dựa trên dữ liệu kết quả. Các mô hình thống kê tiêu chuẩn kết hợp một nhóm các biến số dự đoán, được gán trọng số dựa trên mối quan hệ của chúng với kết quả dự đoán và với nhau. Tuy nhiên, trong nhiều trường hợp, các trọng số này vừa không ổn định về mặt thống kê vừa không quan trọng trong thực tế. Quy tắc đơn giản gán trọng số bằng nhau trên các biến số được lựa chọn có thể sẽ hợp lí. Những thuật toán mà gán trọng số bằng nhau cho các biến số và không dựa vào dữ liệu kết quả đã tỏ ra thành công trong việc lựa chọn nhân sự, dự đoán kết quả bầu cử, dự đoán kết quả trận bóng, và những ứng dụng khác.

Kết luận ở đây là, nếu như bạn định sử dụng một thuật toán để giảm thiểu độ nhiễu, vậy thì bạn không cần phải đợi dữ liệu kết quả. Bạn có thể thu được hầu hết các lợi ích bằng cách sử dụng lẽ thường để lựa chọn các biến số và quy tắc đơn giản nhất có thể để kết hợp chúng.

Các nghiên cứu chỉ ră rằng các thuật toán làm tốt hơn

con người trong vai trò của người ra quyết định.

Tất nhiên, dù có sử dụng kiểu thuật toán nào đi chăng nữa, con người vẫn phải giữ quyền kiểm soát cuối cùng. Các thuật toán cần phải được kiểm tra và điều chỉnh trước những thay đổi không thường xuyên trong toàn bộ hồ sơ. Nhà quản lý cũng cần phải để mắt tới các quyết định cá nhân và có thẩm quyền để ghi đè thuật toán trong những trường hợp rõ ràng. Ví dụ, một quyết định duyệt khoản vay nên tạm thời bị hủy bỏ nếu doanh nghiệp phát hiện ra rằng người nộp đơn vay vốn bị bắt. Quan trọng nhất là, các giám đốc nên quyết định sẽ diễn giải đầu ra thuật toán thành hành động như thế nào. Thuật toán có thể cho bạn biết khoản vay tiềm năng nào nằm trong top 5 hoặc trong nhóm 10% dưới cùng của các hồ sơ xin vay vốn, nhưng một ai đó cần phải quyết định xem sẽ làm gì với thông tin như vậy.

Các thuật toán đôi khi được sử dụng như một nguồn thông tin trung gian đối với các chuyên gia, những người sẽ ra quyết định cuối cùng. Một ví dụ cho điều này là Đánh giá An toàn Cộng đồng (Public Safety Assessment), một công thức được xây dựng nhằm giúp các thẩm phán Hoa Kỳ quyết định xem liệu một bị cáo có an toàn cho xã hội khi được tại ngoại trong lúc chờ xét xử hay không. Trong sáu tháng đầu sử dụng công thức này ở Kentucky, tình trạng phạm tội của các bị cáo được tại ngoại giảm xuống khoảng 15% trong khi tỷ lệ phần trăm số người được tại ngoại tăng lên. Rõ ràng là trong ví dụ này, các vị thẩm phán con người cần phải giữ thẩm quyền cuối cùng đối với việc ra quyết định: Công chúng sẽ rất sốc nếu thấy công lý được thực thi bởi một công thức tính toán.

Mọi người có thể không thoải mái với ý tưởng này, nhưng các nghiên cứu chỉ ra trong khi con người có thể cung cấp đầu vào hữu ích cho các công thức, các thuật toán đã làm tốt hơn trong vai trò người đưa ra quyết định cuối cùng. Nếu như tiêu chí duy nhất là tránh sai sót, các nhà quản lý được khuyên rằng chỉ nên bỏ qua thuật toán trong những trường hợp đặc biệt.

Đưa Kỷ Luật Vào Việc Phán Đoán

Nên cân nhắc đến việc thay thế quyết định của con người bằng thuật toán bất cứ khi nào có độ nhiễu trong đánh giá chuyên môn, nhưng trong hầu hết các trường hợp, giải pháp này sẽ quá quyết liệt hoặc đơn giản là không thực tế. Một giải pháp thay thế là áp dụng các quy trình thúc đẩy tính nhất quán bằng cách đảm bảo các nhân viên ở cùng một vị trí công tác sử dụng phương pháp giống nhau để tìm kiếm thông tin, tích hợp thông tin đó vào quan điểm về vụ việc, và diễn giải quan điểm này thành một quyết định. Việc xem xét mọi thứ kỹ lưỡng để thực hiện điều đó nằm ngoài phạm vi của bài viết này, nhưng chúng tôi có thể đưa ra một vài lời khuyên cơ bản, với lời cảnh báo quan trọng rằng việc áp dụng kỷ luật trong phán đoán không dễ một chút nào.

Tất nhiên, đào tạo là điều thiết yếu, nhưng ngay cả các chuyên gia được đào tạo cùng nhau cũng có khuynh hướng đi theo cách làm việc riêng của mình. Các doanh nghiệp đôi khi chống lại khuynh hướng này bằng cách tổ chức các cuộc họp để những người ra quyết định tập trung lại và cùng xem xét các hồ sơ. Thật không may, hầu hết các cuộc họp ấy đều được tổ chức theo cách quá dễ dàng để đạt tới sự thỏa hiệp, bởi vì những người tham dự sẽ nhanh chóng tập trung vào các ý kiến được đưa ra đầu tiên hoặc tự tin nhất. Nhằm tránh một sự đồng thuận sai lầm như thế, những cá nhân tham gia vào cuộc họp nên nghiên cứu hồ sơ một cách độc lập, đề ra ý kiến mà họ sẵn sàng bảo vệ, và gửi những ý kiến này cho trưởng nhóm vào trước cuộc họp. Những cuộc họp như vậy sẽ mang đến cuộc kiểm tra độ nhiễu hiệu quả, với một bước thêm vào là thảo luận nhóm mà tại đó những quan điểm khác nhau sẽ cùng được nghiên cứu.

Như là một giải pháp thay thế hoặc bổ sung cho thảo luận nhóm, các chuyên gia nên được cung cấp các công cụ thân thiện với người dùng, chẳng hạn như bảng liệt kê các mục cần kiểm tra và các câu hỏi được xây dựng cẩn thận, để hướng dẫn họ khi họ thu thập thông tin về một sự vụ, đưa ra phán đoán tức thời, và đưa ra quyết định cuối cùng. Với mỗi giai đoạn sẽ có những biến thiên không mong muốn, và doanh nghiệp có thể – và nên – kiểm tra xem những công cụ như vậy sẽ giúp giảm thiểu chúng bao nhiêu. Sẽ là lý tưởng khi những người sử dụng các công cụ này xem chúng như là những công cụ hỗ trợ giúp họ thực hiện công việc của mình một cách hiệu quả và kinh tế. Thật không may, kinh nghiệm của chúng tôi cho thấy nhiệm vụ xây dựng công cụ đánh giá vừa hiệu quả lại vừa thân thiện với người dùng trên thực tế khó hơn so với những gì mà nhiều vị giám đốc nghĩ. Kiểm soát độ nhiễu là một việc khó khăn, nhưng chúng tôi kỳ vọng một tổ chức khi tiến hành kiểm tra và đánh giá chi phí tính trên giá trị đồng dollar mà độ nhiễu gây ra sẽ đi đến kết luận rằng nỗ lực để giảm thiểu sự biến thiên ngẫu nhiên là đáng giá.

Mục đích chính của chúng tôi ở bài viết này là giới thiệu với các nhà quản lý khái niệm độ nhiễu như là một nguồn sai sót và giải thích về sự khác biệt của nó so với độ chệch. Thuật ngữ ‘độ chệch’ hay ‘thiên kiến’ đã đi vào ý thức của cộng đồng đến mức từ ‘sai sót’ và ‘sai lệch’ thường được sử dụng thay thế cho nhau. Thực ra, không thể đạt đến những quyết định tốt hơn chỉ bằng việc giảm thiểu thiên kiến chung chung (như là sự lạc quan) hay các thiên kiến xã hội và nhận thức cụ thể (chẳng hạn như sự phân biệt đối xử đối với phụ nữ hoặc hiệu ứng mỏ neo[1]). Các nhà điều hành quan tâm tới tính chính xác cũng nên đối diện với sự phổ biến của tính thiếu nhất quán trong các phán đoán chuyên môn. Độ nhiễu sẽ khó đánh giá hơn so với độ chệch, nhưng nó cũng không hề ít thật hay ít tốn kém hơn.  

Phụ lục 1: Các kiểu Độ nhiễu và Độ Chệch/Thiên kiến

Độ chệch/thiên kiến và độ nhiễu là các loại sai sót khác nhau. Mỗi loại có những biến thể khác nhau và đòi hỏi hành động khắc phục khác nhau.

CÁC LOẠI THIÊN KIẾN

VÍ DỤ

BIỆN PHÁP KHẮC PHỤC

CHUNG CHUNG

Phán đoán thường là sai.

Lỗi lập kế hoạch: Hầu hết các kết quả dự đoán đều lạc quan


Lo ngại rủi ro quá mức: Một công ty đầu tư mạo hiểm từ chối quá nhiều khoản đầu tư hứa hẹn nhưng rủi ro

Liên tục giám sát các quyết định


Các hướng dẫn và mục tiêu về tần suất đạt được một số kết quả nhất định (chẳng hạn như phê duyệt các khoản vay)


Loại bỏ những động cơ dẫn đến thiên kiến

XÃ HỘI


Sự phân biệt đối xử đối với – hoặc vì – một số trường hợp nhất định.

Thường xuyên từ chối tín dụng của những hồ sơ đủ tiêu chuẩn của các nhóm thiểu số nhất định


Định kiến giới trong đánh giá hiệu quả công việc

Theo dõi số liệu thống kê về các nhóm khác nhau


Che thông tin nhạy cảm trong các hồ sơ


Các chỉ số phải mang tính khách quan và có thể định lượng được


Mở ra các kênh khiếu nại

Hướng dẫn và đào tạo

NHẬN THỨC


Các quyết định bị ảnh hưởng mạnh mẽ bởi các yếu tố không liên quan hoặc không nhạy cảm với các yếu tố liên quan.

Ảnh hưởng quá mức của ấn tượng đầu tiên


Hiệu ứng mỏ neo (chẳng hạn như một lời đề nghị mở đầu trong đàm phán)


Bỏ qua các hậu quả trong tương lai do sự thiển cận

Đào tạo nhân viên để phát hiện các tình huống có thể xảy ra thiên kiến


Đánh giá các quyết định quan trọng, tập trung vào những thiên kiến có thể xảy ra

CÁC LOẠI ĐỘ NHIỄU

VÍ DỤ

BIỆN PHÁP KHẮC PHỤC

BIẾN THIÊN QUA CÁC THỜI ĐIỂM


Một cá nhân nhiều lần đưa ra quyết định khác nhau trên cùng một vụ việc.

Đánh giá của một nhà tuyển dụng về một hồ sơ bị ảnh hưởng bởi tâm trạng của cô ấy hoặc chất lượng của ứng viên trước đó

Các thuật toán nhằm thay thế phán đoán của con người


Danh sách kiểm tra khuyến khích cách tiếp cận nhất quán đối với các quyết định

BIẾN THIÊN GIỮA CÁC CÁ NHÂN


Các chuyên gia ở cùng một vị trí đưa ra những quyết định khác nhau.

Một số cá nhân thường khoan dung hơn những người khác


Một số cá nhân thận trọng hơn những người khác

Các thuật toán nhằm thay thế phán đoán của con người


Giám sát thường xuyên quyết định của các cá nhân


Thảo luận nhóm mà tại đó những điểm khác biệt được đưa ra nghiên cứu và giải quyết


Danh sách kiểm tra khuyến khích cách tiếp cận nhất quán đối với các quyết định

Nguồn:  “NOISE,” THÁNG 10, 2016 / © HBR.ORG

Phụ Lục 2: Làm Thế Nào Để Xây Dựng Một Nguyên Tắc Hợp lí

Bạn không cần tới dữ liệu kết quả để tạo ra thuật toán dự đoán hữu ích. Ví dụ, bạn có thể xây dựng một nguyên tắc hợp lí nhằm dự đoán một cách khá hiệu quả những khoản vay sẽ vỡ nợ mà không cần phải biết về điều gì đã xảy ra với những khoản vay trong quá khứ; tất cả những gì bạn cần là một số lượng nhỏ những hồ sơ tín dụng trong thời gian gần đây. Những bước tiếp theo là:

1.Chọn ra sáu đến tám biến số khác biệt và rõ ràng có liên quan đến kết quả dự đoán. Tài sản và doanh thu (được tính theo tỉ trọng dương) và nợ phải trả (được tính theo tỉ trọng âm) chắc chắn sẽ được đưa vào, cùng với một vài đặc trưng khác của các hồ sơ vay vốn.

  1. Lấy dữ liệu từ tập hợp hồ sơ của bạn (tất cả những đơn xin vay vốn từ năm ngoái) và tính toán giá trị trung bình và độ lệch chuẩn của mỗi biến số trong tập đó.
  2. Với mỗi một hồ sơ trong tập đã chọn, hãy tính “điểm chuẩn” cho từng biến: chênh lệch giữa giá trị trong hồ sơ với giá trị trung bình của cả tập hợp, chia cho độ lệch chuẩn. Với các điểm chuẩn, tất cả các biến số được thể hiện trên cùng một thang đo và có thể được so sánh và lấy trung bình.
  3. Tính toán “điểm tín dụng/điểm số tóm tắt” (summary score) cho mỗi hồ sơ – điểm trung bình của điểm chuẩn của các biến số trong đó. Đây là đầu ra của nguyên tắc hợp lí. Công thức tương tự sẽ được áp dụng cho các hồ sơ mới, sử dụng giá trị trung bình và độ lệch chuẩn của tập hợp hồ sơ gốc và được cập nhật theo định kỳ.
  4. Sắp xếp các hồ sơ trong tập hợp theo tứ tự điểm tín dụng hoặc điểm số tóm tắt từ cao đến thấp, và quyết định hành động thích hợp cho các khung điểm khác nhau. Chẳng hạn, với các hồ sơ tín dụng, hành động ở đây có thể là các hồ sơ trong nhóm “10% đứng đầu sẽ được nhận chiết khấu” và “30% đứng cuối sẽ bị từ chối.”

Giờ thì bạn đã sẵn sàng để áp dụng quy tắc này cho các hồ sơ mới. Thuật toán sẽ tính toán một điểm số tóm tắt cho mỗi hồ sơ mới và đưa ra quyết định.

Daniel Kahneman (5/3/1934 – 27/3/024) là Giáo sư Eugene Higgins[2] về Tâm lý học, Giáo sư danh dự, và Giáo sư Tâm lý học và Quan hệ Công Chúng tại Đại học Princeton. Ông đã đạt giải Nobel Kinh tế vào năm 2002 cho công trình nghiên cứu của ông (cùng với Amos Tversky) về thiên kiến nhận thức.

Andrew M. Rosenfield là CEO và đối tác quản lý của công ty tư vấn The Greatest Good Group (TGG Group).

Linnea Gandhi là trợ giảng ngành Khoa học hành vi tại Chicago Booth và điều hành BehavioralSight, một công ty chuyên ứng dụng nghiên cứu học thuật vào kinh doanh.

Tom Blaser là giám đốc điều hành tại công ty tư vấn The Greatest Good Group (TGG Group).

[1] Hiệu ứng mỏ neo (Anchoring Effect) hay ảo giác tập trung là một thiên kiến nhận thức. Hiệu ứng này khiến một cá nhân bị ảnh hưởng quá nhiều bởi một mẩu thông tin được cung cấp ban đầu (được gọi là “mỏ neo”) khi đưa ra các phán đoán tiếp theo trong quá trình ra quyết định. Khi giá trị của mỏ neo này được đặt (“thả neo”), mọi cuộc đàm phán, lập luận hay ước tính trong tương lai sẽ liên quan đến neo. Thông tin phù hợp với mỏ neo thường sẽ được gộp vào, còn những thông tin trái ngược hoặc ít liên quan lại có xu hướng bị thay thế. Thiên kiến này xảy ra khi sử dụng mỏ neo để đánh giá diễn giải thông tin trong tương lai.

[2] Giáo sư Eugene Higgins (Eugene Higgins Professor) là một chức danh giáo sư danh dự tại Đại học Princeton, Hoa Kỳ. Chức danh này được đặt theo tên của Eugene Higgins, một nhà từ thiện và nhà đầu tư nổi tiếng, người đã đóng góp nhiều cho Đại học Princeton. Chức danh “Eugene Higgins Professor” thường được trao cho các nhà khoa học và học giả xuất sắc trong lĩnh vực vật lý hoặc các lĩnh vực liên quan. Hiện nay, có hai người đang giữ chức danh “Eugene Higgins Professor” là Duncan Haldane (nhà vật lý người Scotland-Slovenia, đã đoạt giải Nobel Vật lý năm 2016) và Daniel Kahneman.

Nguồn

https://huongtdao.wordpress.com/2024/03/30/do-nhieu-lam-the-nao-de-vuot-qua-chi-phi-cao-va-an-cua-su-thieu-nhat-quan-trong-viec-ra-quyet-dinh/

menu
menu