พูดง่ายๆ ก็คือ นิพจน์ทั่วไปคือลำดับของอักขระที่ใช้เป็นหลักในการค้นหาและแทนที่รูปแบบในสตริงหรือไฟล์ รองรับโดยภาษาการเขียนโปรแกรมส่วนใหญ่ เช่น python, perl, R, Java และอื่นๆ
นิพจน์ทั่วไปมีประโยชน์มากในการดึงข้อมูลจากข้อความ เช่น รหัส ไฟล์บันทึก สเปรดชีต หรือแม้แต่เอกสาร เราจัดการกับการใช้นิพจน์ทั่วไปในทางปฏิบัติมากขึ้น
สิ่งแรกที่ต้องรู้เมื่อใช้นิพจน์ทั่วไปคือทุกอย่างโดยพื้นฐานแล้วเป็นอักขระ และเราเขียนรูปแบบเพื่อให้ตรงกับลำดับอักขระเฉพาะ (หรือที่เรียกว่าสตริง) รูปแบบส่วนใหญ่ใช้ ASCII ปกติ ซึ่งรวมถึงตัวอักษร ตัวเลข เครื่องหมายวรรคตอน และสัญลักษณ์อื่นๆ บนแป้นพิมพ์คอมพิวเตอร์ เช่น %#$@! แต่อักขระ Unicode สามารถใช้จับคู่ข้อความสากลประเภทใดก็ได้
ใน Python มีโมดูล "re" ที่ทำงานบนนิพจน์ทั่วไป ดังนั้น คุณต้องนำเข้าไลบรารี่ re ก่อนจึงจะสามารถใช้นิพจน์ทั่วไปใน Python ได้
การใช้นิพจน์ทั่วไปที่พบบ่อยที่สุดคือ:
ค้นหาสตริง (ค้นหาและจับคู่)
การหาสตริง (findall)
แยกสตริงออกเป็นสตริงย่อย (แยก)
แทนที่ส่วนของสตริง (ย่อย)