Text Steganography เป็นวิธีการซ่อนข้อความลับภายในข้อความอื่นเป็นข้อความครอบคลุมหรือสร้างข้อความหน้าปกที่เกี่ยวข้องกับข้อความลับเริ่มต้น
การลบล้างข้อความอาจรวมถึงอะไรก็ได้ตั้งแต่การเปลี่ยนรูปแบบข้อความที่มีอยู่ ไปจนถึงการเปลี่ยนคำในข้อความ ไปจนถึงการสร้างลำดับอักขระแบบสุ่ม หรือใช้ไวยากรณ์ที่ปราศจากบริบทเพื่อสร้างข้อความที่อ่านได้
การลบล้างข้อความถือเป็นขั้นตอนที่ยุ่งยากที่สุดเนื่องจากขาดข้อมูลที่ซ้ำซ้อนซึ่งปรากฏอยู่ในไฟล์รูปภาพ เสียง หรือวิดีโอ กลไกของเอกสารข้อความเหมือนกันกับสิ่งที่สามารถระบุได้ ในขณะที่เอกสารประเภทอื่นรวมถึงในภาพ โครงสร้างของเอกสารแตกต่างจากสิ่งที่สามารถระบุได้
ดังนั้นในเอกสารดังกล่าว มันสามารถซ่อนข้อมูลโดยการเรียนรู้การเปลี่ยนแปลงในโครงสร้างของเอกสารโดยไม่ต้องสร้างการเปลี่ยนแปลงที่มีชื่อเสียงในผลลัพธ์ที่เกี่ยวข้อง
การเปลี่ยนแปลงที่ไม่สามารถรับรู้ได้สามารถสร้างได้กับรูปภาพหรือไฟล์เสียง แต่ในไฟล์ข้อความ แม้แต่ตัวอักษรหรือเครื่องหมายวรรคตอนเพิ่มเติมก็สามารถสังเกตเห็นได้สำหรับผู้อ่านทั่วไป มันสามารถบันทึกไฟล์ข้อความที่ต้องใช้หน่วยความจำน้อยกว่าและเร็วกว่ารวมถึงการสื่อสารที่ง่ายกว่าทำให้เป็นที่นิยมกว่าวิธีการ steganographic ประเภทอื่นๆ
Steganography ข้อความสามารถกำหนดได้โดยทั่วไปเป็นสามประเภทรวมถึงรูปแบบตามการสร้างแบบสุ่มและทางสถิติ, วิธีการทางภาษาศาสตร์ซึ่งมีดังต่อไปนี้ -
วิธีการตามรูปแบบ − วิธีการตามรูปแบบรวมถึงการเปลี่ยนรูปแบบของข้อความทางกายภาพเพื่อปกปิดข้อมูล วิธีนี้มีข้อบกพร่องเฉพาะ หากไฟล์ stego เปิดขึ้นโดยใช้โปรแกรมประมวลผลคำ ระบบจะระบุการสะกดผิดและช่องว่างเพิ่มเติม
ขนาดแบบอักษรที่เปลี่ยนแปลงสามารถกระตุ้นความสงสัยให้กับผู้อ่านที่เป็นมนุษย์ นอกจากนี้ หากเข้าถึงข้อความธรรมดาเริ่มต้นได้ การเปรียบเทียบข้อความธรรมดานี้กับข้อความอำพรางกราฟิกที่น่าสงสัย สามารถสร้างองค์ประกอบที่มีการจัดการของข้อความที่มองเห็นได้ชัดเจน
การสุ่มและการสร้างสถิติ − ในการสร้างแบบสุ่มและเชิงสถิติ มันสามารถป้องกันได้โดยสอดคล้องกับข้อความธรรมดาที่รู้จัก นักจดบันทึกสถิติจะใช้วิธีสร้างข้อความหน้าปกของตนเอง วิธีหนึ่งคือการปกปิดข้อมูลในลำดับการดูแบบสุ่มของอักขระ
ในอีกวิธีหนึ่ง คุณลักษณะทางสถิติของความยาวคำและความถี่ของตัวอักษรจะใช้เพื่อสร้างคำที่จะเกิดขึ้นเพื่อให้มีคุณสมบัติทางสถิติที่คล้ายคลึงกันกับคำจริงในภาษาที่กำหนด
สำนวนภาษาศาสตร์ − Steganography ทางภาษาศาสตร์จะพิจารณาคุณสมบัติทางภาษาของข้อความที่สร้างขึ้นและดัดแปลงเป็นพิเศษ และในบางกรณีก็ใช้กลไกทางภาษาศาสตร์เป็นพื้นที่สำหรับเก็บข้อความไว้
CFG สามารถสร้างโครงสร้างแบบต้นไม้ซึ่งสามารถใช้เพื่อปกปิดบิตที่สาขาด้านซ้ายกำหนด '0' และสาขาด้านขวาสัมพันธ์กับ '1'
สามารถใช้ไวยากรณ์ใน GNF โดยที่ตัวเลือกแรกในการผลิตกำหนดบิต 0 และตัวเลือกที่สองกำหนดบิต 1 วิธีนี้มีข้อเสียบางประการ ขั้นแรก ไวยากรณ์ขนาดเล็กจะทำให้ข้อความซ้ำหลายครั้ง
ประการที่สอง แม้ว่าข้อความจะไร้ที่ติตามหลักไวยากรณ์ แต่มีข้อเสียเปรียบของสถาปัตยกรรมเชิงความหมาย ผลลัพธ์คือชุดประโยคที่ไม่สัมพันธ์กัน