การศึกษาภาษาและภาษาศาสตร์มักจะต้องการข้อมูลเกี่ยวกับวิธีการใช้คำ โดยเฉพาะอย่างยิ่งเมื่อเวลาผ่านไป แม้ว่าการวิจัยจะมีความจำเป็น แต่ก็มีเครื่องมือที่จะให้ข้อมูลที่คุณต้องการได้ Google Ngram Viewer เป็นวิธีที่ยอดเยี่ยมในการค้นหาเทรนด์คำศัพท์ทั่วทั้งห้องสมุด Google หนังสือได้อย่างรวดเร็ว
ในโพสต์นี้ เราจะแสดงให้คุณเห็นถึงวิธีการใช้ Google Ngram อย่างมีประสิทธิภาพมากขึ้น ขั้นแรก มาแนะนำคุณเกี่ยวกับเครื่องมือนี้
แนะนำ Google Ngram
Google รักษาฐานข้อมูลหลายภาษาของภาษาที่เผยแพร่ โดยการสแกนหนังสือจำนวนมาก ยักษ์ใหญ่ในการค้นหาสามารถประมวลผลข้อความและให้สถิติตามความถี่ของคำได้
ด้วยเครื่องมือค้นหา Google Ngram Viewer คุณสามารถค้นหาข้อมูลนี้ได้ คุณสามารถจับคู่ว่าภาษาและวัฒนธรรมเปลี่ยนแปลงไปอย่างไรเมื่อเวลาผ่านไปโดยการเปรียบเทียบความนิยมสัมพัทธ์ของคำ
อย่างไรก็ตาม เครื่องมือ Google Ngram ทำได้มากกว่าแค่รายงานความถี่ของคำ ในขณะที่เราจะพูดถึง
วิธีดำเนินการค้นหาขั้นพื้นฐาน
ก่อนที่เราจะเข้าสู่ "กลยุทธ์" ขั้นสูง มาดูวิธีดำเนินการค้นหาพื้นฐานกันก่อน จากหน้า Google Ngram ให้พิมพ์คำสำคัญลงในช่องค้นหา
หากคุณต้องการใส่อักษรตัวพิมพ์ใหญ่ทั้งหมดของคำ ให้ทำเครื่องหมายที่ปุ่มไม่คำนึงถึงตัวพิมพ์เล็กและตัวพิมพ์ใหญ่ การค้นหานี้จะรวมถึง “Tech” และ “Tech”
ใต้ช่องค้นหา คุณยังสามารถตั้งค่าพารามิเตอร์ เช่น ช่วงวันที่และ "การปรับให้เรียบ" ได้อีกด้วย ค่าหลังจะลบ spikes และ dip ที่ผิดปกติออกจากข้อมูลของคุณ ค่าการปรับให้เรียบที่ต่ำกว่านั้นแม่นยำกว่า ในขณะที่ค่าที่สูงกว่าจะแสดงเฉพาะแนวโน้มที่ลึกกว่าเท่านั้น
วิธีการเลือก “คลังข้อมูล”
คลังข้อมูลคือชุดข้อความที่ Ngram Viewer จะตรวจสอบ ค่าเริ่มต้นของ “ภาษาอังกฤษ” เป็นที่ยอมรับสำหรับการท่องเว็บแบบไม่เป็นทางการ แต่สามารถใช้ในการศึกษาระดับสูงได้
“นิยายภาษาอังกฤษ” จะสะท้อนถึงภาษาทั่วไปอย่างใกล้ชิดมากขึ้น คลังข้อมูล "ภาษาอังกฤษ" แบบมาตรฐานอาจเป็นเนื้อหาที่ไม่ใช่นิยายและมีคำศัพท์ทางเทคนิคมากมาย
ในขณะที่ความหมายที่ลึกซึ้งเบื้องหลังการเลือกคลังข้อมูลของคุณนั้นอยู่นอกเหนือขอบเขตของงานชิ้นนี้ Google นำเสนอข้อมูลเชิงลึกโดยสังเขปเกี่ยวกับตัวเลือกที่เหมาะสมสำหรับคุณ
ดำเนินการค้นหาขั้นสูง
เมื่อใช้คำค้นหาเพิ่มเติม คุณสามารถสร้างการเปรียบเทียบที่ซับซ้อนได้ เมื่อต้องการทำสิ่งนี้ ให้คั่นแต่ละเทอมด้วยเครื่องหมายจุลภาค
Ngram Viewer จะแสดงความถี่สัมพัทธ์ของข้อความค้นหาของคุณในกราฟเดียว ที่นี่ คุณสามารถวางเมาส์เหนือเส้นของกราฟเพื่อดูจุดข้อมูลที่แม่นยำ
คุณยังสามารถใช้เครื่องหมายดอกจันในข้อความค้นหาของคุณเป็นสัญลักษณ์แทนได้ ตัวอย่างเช่น “ปริญญาตรีของ *” จะแสดงผลลัพธ์สำหรับปริญญาตรีหลายใบ
หากต้องการค้นหาการผันคำทั้งหมด ให้ต่อท้ายตัวแก้ไข “_INF”
หากคำมีคำพูดหลายส่วน คุณสามารถใช้ตัวดำเนินการข้อความให้เฉพาะเจาะจงมากขึ้นได้ ส่วนต่างๆ ของคำพูดที่ถูกต้องในฐานข้อมูลของ Google มีทั้งหมดดังต่อไปนี้:
- _ADJ_ :คำคุณศัพท์ (เร็ว ใหญ่ ฉลาด)
- _ADV_ :คำวิเศษณ์ (เร็ว, ภายหลัง, เสมอ)
- _PRON_ :สรรพนาม (พวกเขา มัน เรา)
- _DET_ :ตัวกำหนดหรือบทความ (a, an, the)
- _ADP_ :adposition (บุพบทและ postpositions)
- _NUM_ :ตัวเลข (หนึ่ง สอง ห้า)
- _CONJ__ :คำสันธาน (และ, หรือ ก)
- _PRT_ :อนุภาค ซึ่งเป็นหมวดหมู่ที่ไม่ค่อยได้ใช้สำหรับฟังก์ชันคำอื่นๆ
สิ่งเหล่านี้สามารถรวมกันเป็นวลีได้ ตัวอย่างเช่น “_ADJ_ boy” จะส่งกลับคู่คำสำหรับคำคุณศัพท์และ “boy”
หากต้องการระบุส่วนของคำพูดเฉพาะสำหรับคำค้นหาหนึ่งคำ ให้ต่อท้ายคำ ตัวอย่างเช่น “water_VERB” โดยไม่มีขีดล่าง หากต้องการรวมทุกส่วนของคำพูดสำหรับคำที่กำหนด ให้ใช้ตัวดำเนินการตัวแทนหลังเครื่องหมายขีดล่าง
ตัวแปรการทำงาน องค์ประกอบ และการขึ้นต่อกัน
ตัวแปรฟังก์ชันช่วยให้คุณค้นหาตามฟังก์ชันหรือตำแหน่งของคำได้
- _ROOT_ เป็นตัวยึดตำแหน่งสำหรับรูทของ parse tree ของประโยค โดยทั่วไปจะเป็นประธานหรือคำที่กริยาแก้ไข
- _START_ บ่งบอกถึงจุดเริ่มต้นของประโยค (“_START_ President Obama” ส่งกลับเฉพาะประโยคที่ เริ่มต้น ด้วยวลี “ประธานาธิบดีโอบามา”)
- _END_ บ่งชี้จุดสิ้นสุดของประโยค (“_ADP_ _END_” ส่งคืนประโยคที่ จบ ในคำบุพบท)
เมื่อรวมข้อความค้นหาเข้ากับตัวดำเนินการเลขคณิต คุณจะทำการวิเคราะห์ทางคณิตศาสตร์อย่างง่ายด้วยค่าความถี่ของคำได้:
- + เพิ่มนิพจน์หลายคำในคำค้นหาเดียว
- – ลบนิพจน์ทางด้านขวาออกจากนิพจน์ทางด้านซ้าย เป็นวิธีที่รวดเร็วในการเปรียบเทียบการใช้คำค้นหาสองคำที่เกี่ยวข้องกัน
- / แบ่งนิพจน์ทางด้านซ้ายโดยนิพจน์ทางด้านขวา
- * คูณนิพจน์เพื่อเปรียบเทียบ ngrams ของความถี่ที่หลากหลาย ตรวจสอบให้แน่ใจว่าได้ใส่ ngram ทั้งหมดไว้ในวงเล็บเพื่อหลีกเลี่ยงไม่ให้มีการแยกวิเคราะห์เครื่องหมายดอกจันเป็นอักขระตัวแทน
- : (โคลอน) ค้นหา ngram ทางด้านซ้ายภายใน corpus ทางด้านขวา
สุดท้าย คุณสามารถตั้งค่าการพึ่งพาด้วย “=>” เพื่อค้นหาความสัมพันธ์ทางภาษาได้
ตัวอย่างเช่น "car=>fast" จะแสดงผลลัพธ์โดยที่ "fast" ขึ้นอยู่กับไวยากรณ์หรือการปรับเปลี่ยนคำว่า "car" ซึ่งสามารถผสมได้อย่างอิสระกับการดำเนินการค้นหาขั้นสูงใดๆ
บทสรุป
การค้นหาแนวโน้มคำศัพท์มีแอปพลิเคชั่นทางวิชาการมากมาย วิธีที่รวดเร็วในการค้นหาข้อมูลที่คุณต้องการคือเครื่องมือ Ngram ของ Google ข่าวดีก็คือมันไม่เพียงแต่ให้คุณทำการค้นหาพื้นฐานเท่านั้น คุณสามารถใช้ตัวปรับแต่งที่มีประสิทธิภาพเพื่อปรับแต่งข้อมูลที่คุณต้องการได้
ฟังก์ชันการทำงานของ Google Ngram จะไม่เกิดขึ้นหากไม่มีเสียงฮึดฮัดขั้นสูงของเครื่องมือค้นหาภายใต้ประทุน คุณประทับใจกับสิ่งที่เครื่องมือ Google Ngram สามารถทำได้หรือไม่? แจ้งให้เราทราบในส่วนความคิดเห็นด้านล่าง!