เทคโนโลยีจับทุจริตผู้บริหาร ด้วยการวิเคราะห์ Text
ผมไปอ่านเจอบทความน่าสนใจ คนเขียนคุณ Jason Voss เค้าเป็น CFA และเป็นคนที่ทำพวกโปรแกรมสำหรับวิเคราะห์ข้อความเพื่อจับสัญญาณการหลอก ในบทความเค้าพยายามจะบอกว่าการจับทุจริตโดยคนมันไม่ได้ผล เราควรจะเริ่มหันมาใช้โปรแกรมคอมได้แล้ว โอเคบางส่วนเค้าอาจจะพยายามขายตัวบริการของบริษัทเค้าแต่เหตุผลที่เค้าอ้างก็น่าสนใจทีเดียว
- ในรายงานประจำปี ตัวเลขเป็นแค่ 13.5% ของทั้งหมด ส่วนใหญ่เป็นข้อความ
- การใช้คนทำติดปัญหาเรื่องข้อจำกัดด้านเวลา
- เคยมีการทดสอบและพบว่าความสามารถในการจับโกหกของคนค่อนข้างห่วย
- ผู้ตรวจสอบบัญชีเองก็มีข้อจำกัด
- การวิเคราะห์ตัวข้อความได้ผล
- สิ่งที่บริษัทเค้าทำเพื่อแก้ปัญหานี้คือการวิเคราะห์โครงสร้างของประโยคหรือการใช้ภาษา ไม่ใช่แค่ว่าใช้คำว่าอะไรเฉยๆ
ดังนั้นการวิเคราะห์ใดๆก็สมควรที่จะให้ความสำคัญกับการวิเคราะห์ตัวข้อความด้วย ไม่ใช่ตัวเลขเฉยๆ
รายงานประจำปีมันยาว บริษัทส่วนใหญ่ก็เป็นร้อยหน้า ถ้าจะใช้คนอ่านทั้งหมดก็ใช้เวลาเยอะมากและไม่ใช่ทุกหน่วยงานจะสามารถจ้างนักวิเคราะห์จำนวนมากพอที่จะอ่านข้อมูลพวกนี้ทั้งหมด
เฉลี่ยจากการวิจัยจำนวนมากพบว่าทำได้ดีกว่าสุ่มแค่ 4% และคนเขียนมีทำทดสอบคนในสายงานการเงินพบว่าเดาถูกแค่ 49.4% เท่านั้น หรือถ้าทดสอบด้วยเนื้อหาที่เกี่ยวกับไฟแนนซ์เช่น earnings call ก็เดาถูกเยอะขึ้นแต่ก็แค่ 51.8% เท่านั้น
เป็นการตรวจตัวเลขเช่นกัน ไม่ได้วิเคราะห์จากตัวข้อความที่เป็นส่วนใหญ่ของรายงาน
เคยมีการใช้ NLP (Natural Language Processing) ในการวิเคราะห์ มีการเอาคำที่ใช้, ภาษาที่ใช้, ความถี่ของการใช้คำบางประเภทมาทดสอบว่าสามารถจับการหลอกลวงได้มั้ย ผลคือทำได้อยู่ประมาณ 64-80% ซึ่งดีกว่าคนมาก และที่สำคัญใช้เวลาน้อยกว่าให้คนมานั่งอ่านเยอะมาก
จนในภายหลังเมื่อมีคนใช้วิธีการนี้มากขึ้น บริษัทก็เริ่มจ้างคนที่ทำ NLP มาใช้กับรายงานของตัวเองเพื่อกำจัดการใช้คำที่มีปัญหาออกไป เลยทำให้การจับโกหกด้วยการมองหา keyword คำบางประเภททำได้ยากขึ้น
อันนี้เค้าก็อ้างว่าใช้จับโกหกได้เกิน 70% และจากการทดสอบกับเคสโกหกใหญ่ๆในอดีตก็ใช้ได้ผล สามารถจับว่ามีการหลอกได้ล่วงหน้าก่อนที่บริษัทจะเริ่มเกิดปัญหายาวนานถึง 6 ปี
แล้วเค้าก็เล่าให้ฟังว่ามันมีสัญญาณบ่งชี้สำคัญอยู่ 5 อันที่ถ้าเจอในบริษัทไหน บริษัทนั้นมีโอกาสจะผิดปกติเยอะขึ้นกว่าสัญญาณอันอื่น
สัญญาณ 5 อันมีดังนี้
- ใช้คำที่สื่อถึงความเป็นมิตรเป็นพวกเดียวกัน
- ใช้คำที่สื่อถึงความเสี่ยง
- ใช้คำสรรพนามที่ไม่เจาะจง
- ไม่ใช้คำที่พูดถึงความแตกต่าง
- ใช้คำที่เป็นการปฏิเสธ
เค้าพบว่าบริษัทที่พยายามจะหลอกจะพยายามสร้างความรู้สึกว่าเป็นมิตรมากกว่าบริษัทปกติ ตัวอย่างคำประเภทนี้เช่น “เพื่อน”, “พรรคพวก”, “แก๊งค์”, “เพื่อนบ้าน”, ฯลฯ
บริษัทที่พยายามหลอกมีการใช้คำที่สื่อหรือเกี่ยวข้องกับความเสี่ยงเยอะกว่าปกติ ตัวอย่างคำก็เช่น “หลีกเลี่ยง”, “น่าเป็นห่วง”, “น่ากังวล”, “ป้องกัน”, “ยากลำบาก”, “หยุด”, ฯลฯ
คำสรรพนามที่ไม่เจาะจงเช่น “คนอื่น”, “ทุกคน”, “ใครบางคน”, “อันไหนซักอัน”, ฯลฯ
เค้าพบว่าบริษัทที่พยายามจะหลอกจะใช้คำที่สื่อถึงความแตกต่างหรือทำการเปรียบเทียบน้อยกว่า ประโยคที่พูดถึงความแตกต่างหรือการเปรียบเทียบเช่น “เมื่อเปรียบเทียบกับปีที่แล้วบริษัท …”
เช่น “ไม่ใช่”, “ไม่เคย”, “ไม่ควร”, “ไม่ได้ทำ”, “อย่าทำ”, ฯลฯ
นอกเหนือจากนี้ก็จะมีอีกกรณีที่หายากซึ่งคือการใช้คำสบถ แต่ถ้าเจอนี่คือส่อแววโอกาสจะมีปัญหาสูงมาก
โดยรวมเรื่องนี้อาจจะไม่ได้กระทบอะไรกับเราเท่าไหร่ เพราะเราที่เป็นนักลงทุนรายย่อยก็คงไม่ไปซื้อโปรแกรมมาทำอยู่แล้ว แต่ผมว่าการศึกษาการใช้ภาษาว่าแบบไหนส่อแววจะโกหกก็เป็นการศึกษาที่น่าสนใจทีเดียว
เผื่อใครสนใจอ่านผมทิ้งลิ้งค์เอาไว้ให้ครับ https://blogs.cfainstitute.org/investor/2021/02/15/fraud-and-deception-detection-text-based-analysis/
ฟังแล้วเป็นยังไงบ้าง Comment ได้เลยนะครับ
หากชอบเนื้อหา อย่าลืมกด Like & Share และ Follow เราในช่องทางต่างๆ ได้ตามนี้ 🙂
ติดตามพวกเราได้บน Facebook https://www.facebook.com/smartstockinvestment/
หรือทาง YouTube https://www.youtube.com/channel/UCXXwuZIQdWiS1OIzy0uP1fg
ตอนนี้เรามีคอร์ส Workshop ออนไลน์แล้วด้วยนะ
https://www.adisonc.com/
หรือ ทดลองเรียนฟรี