Computer >> คอมพิวเตอร์ >  >> ระบบเครือข่าย >> อินเทอร์เน็ต

วิธีใช้ Google Ngram อย่างมีประสิทธิภาพมากขึ้น

วิธีใช้ Google Ngram อย่างมีประสิทธิภาพมากขึ้น

การศึกษาภาษาและภาษาศาสตร์มักจะต้องการข้อมูลเกี่ยวกับวิธีการใช้คำ โดยเฉพาะอย่างยิ่งเมื่อเวลาผ่านไป แม้ว่าการวิจัยจะมีความจำเป็น แต่ก็มีเครื่องมือที่จะให้ข้อมูลที่คุณต้องการได้ Google Ngram Viewer เป็นวิธีที่ยอดเยี่ยมในการค้นหาเทรนด์คำศัพท์ทั่วทั้งห้องสมุด Google หนังสือได้อย่างรวดเร็ว

ในโพสต์นี้ เราจะแสดงให้คุณเห็นถึงวิธีการใช้ Google Ngram อย่างมีประสิทธิภาพมากขึ้น ขั้นแรก มาแนะนำคุณเกี่ยวกับเครื่องมือนี้

แนะนำ Google Ngram

Google รักษาฐานข้อมูลหลายภาษาของภาษาที่เผยแพร่ โดยการสแกนหนังสือจำนวนมาก ยักษ์ใหญ่ในการค้นหาสามารถประมวลผลข้อความและให้สถิติตามความถี่ของคำได้

ด้วยเครื่องมือค้นหา Google Ngram Viewer คุณสามารถค้นหาข้อมูลนี้ได้ คุณสามารถจับคู่ว่าภาษาและวัฒนธรรมเปลี่ยนแปลงไปอย่างไรเมื่อเวลาผ่านไปโดยการเปรียบเทียบความนิยมสัมพัทธ์ของคำ

อย่างไรก็ตาม เครื่องมือ Google Ngram ทำได้มากกว่าแค่รายงานความถี่ของคำ ในขณะที่เราจะพูดถึง

วิธีดำเนินการค้นหาขั้นพื้นฐาน

ก่อนที่เราจะเข้าสู่ "กลยุทธ์" ขั้นสูง มาดูวิธีดำเนินการค้นหาพื้นฐานกันก่อน จากหน้า Google Ngram ให้พิมพ์คำสำคัญลงในช่องค้นหา

วิธีใช้ Google Ngram อย่างมีประสิทธิภาพมากขึ้น

หากคุณต้องการใส่อักษรตัวพิมพ์ใหญ่ทั้งหมดของคำ ให้ทำเครื่องหมายที่ปุ่มไม่คำนึงถึงตัวพิมพ์เล็กและตัวพิมพ์ใหญ่ การค้นหานี้จะรวมถึง “Tech” และ “Tech”

ใต้ช่องค้นหา คุณยังสามารถตั้งค่าพารามิเตอร์ เช่น ช่วงวันที่และ "การปรับให้เรียบ" ได้อีกด้วย ค่าหลังจะลบ spikes และ dip ที่ผิดปกติออกจากข้อมูลของคุณ ค่าการปรับให้เรียบที่ต่ำกว่านั้นแม่นยำกว่า ในขณะที่ค่าที่สูงกว่าจะแสดงเฉพาะแนวโน้มที่ลึกกว่าเท่านั้น

วิธีการเลือก “คลังข้อมูล”

คลังข้อมูลคือชุดข้อความที่ Ngram Viewer จะตรวจสอบ ค่าเริ่มต้นของ “ภาษาอังกฤษ” เป็นที่ยอมรับสำหรับการท่องเว็บแบบไม่เป็นทางการ แต่สามารถใช้ในการศึกษาระดับสูงได้

วิธีใช้ Google Ngram อย่างมีประสิทธิภาพมากขึ้น

“นิยายภาษาอังกฤษ” จะสะท้อนถึงภาษาทั่วไปอย่างใกล้ชิดมากขึ้น คลังข้อมูล "ภาษาอังกฤษ" แบบมาตรฐานอาจเป็นเนื้อหาที่ไม่ใช่นิยายและมีคำศัพท์ทางเทคนิคมากมาย

ในขณะที่ความหมายที่ลึกซึ้งเบื้องหลังการเลือกคลังข้อมูลของคุณนั้นอยู่นอกเหนือขอบเขตของงานชิ้นนี้ Google นำเสนอข้อมูลเชิงลึกโดยสังเขปเกี่ยวกับตัวเลือกที่เหมาะสมสำหรับคุณ

ดำเนินการค้นหาขั้นสูง

เมื่อใช้คำค้นหาเพิ่มเติม คุณสามารถสร้างการเปรียบเทียบที่ซับซ้อนได้ เมื่อต้องการทำสิ่งนี้ ให้คั่นแต่ละเทอมด้วยเครื่องหมายจุลภาค

วิธีใช้ Google Ngram อย่างมีประสิทธิภาพมากขึ้น

Ngram Viewer จะแสดงความถี่สัมพัทธ์ของข้อความค้นหาของคุณในกราฟเดียว ที่นี่ คุณสามารถวางเมาส์เหนือเส้นของกราฟเพื่อดูจุดข้อมูลที่แม่นยำ

วิธีใช้ Google Ngram อย่างมีประสิทธิภาพมากขึ้น

คุณยังสามารถใช้เครื่องหมายดอกจันในข้อความค้นหาของคุณเป็นสัญลักษณ์แทนได้ ตัวอย่างเช่น “ปริญญาตรีของ *” จะแสดงผลลัพธ์สำหรับปริญญาตรีหลายใบ

วิธีใช้ Google Ngram อย่างมีประสิทธิภาพมากขึ้น

หากต้องการค้นหาการผันคำทั้งหมด ให้ต่อท้ายตัวแก้ไข “_INF”

วิธีใช้ Google Ngram อย่างมีประสิทธิภาพมากขึ้น

หากคำมีคำพูดหลายส่วน คุณสามารถใช้ตัวดำเนินการข้อความให้เฉพาะเจาะจงมากขึ้นได้ ส่วนต่างๆ ของคำพูดที่ถูกต้องในฐานข้อมูลของ Google มีทั้งหมดดังต่อไปนี้:

  • _ADJ_ :คำคุณศัพท์ (เร็ว ใหญ่ ฉลาด)
  • _ADV_ :คำวิเศษณ์ (เร็ว, ภายหลัง, เสมอ)
  • _PRON_ :สรรพนาม (พวกเขา มัน เรา)
  • _DET_ :ตัวกำหนดหรือบทความ (a, an, the)
  • _ADP_ :adposition (บุพบทและ postpositions)
  • _NUM_ :ตัวเลข (หนึ่ง สอง ห้า)
  • _CONJ__ :คำสันธาน (และ, หรือ ก)
  • _PRT_ :อนุภาค ซึ่งเป็นหมวดหมู่ที่ไม่ค่อยได้ใช้สำหรับฟังก์ชันคำอื่นๆ

สิ่งเหล่านี้สามารถรวมกันเป็นวลีได้ ตัวอย่างเช่น “_ADJ_ boy” จะส่งกลับคู่คำสำหรับคำคุณศัพท์และ “boy”

หากต้องการระบุส่วนของคำพูดเฉพาะสำหรับคำค้นหาหนึ่งคำ ให้ต่อท้ายคำ ตัวอย่างเช่น “water_VERB” โดยไม่มีขีดล่าง หากต้องการรวมทุกส่วนของคำพูดสำหรับคำที่กำหนด ให้ใช้ตัวดำเนินการตัวแทนหลังเครื่องหมายขีดล่าง

ตัวแปรการทำงาน องค์ประกอบ และการขึ้นต่อกัน

วิธีใช้ Google Ngram อย่างมีประสิทธิภาพมากขึ้น

ตัวแปรฟังก์ชันช่วยให้คุณค้นหาตามฟังก์ชันหรือตำแหน่งของคำได้

  • _ROOT_ เป็นตัวยึดตำแหน่งสำหรับรูทของ parse tree ของประโยค โดยทั่วไปจะเป็นประธานหรือคำที่กริยาแก้ไข
  • _START_ บ่งบอกถึงจุดเริ่มต้นของประโยค (“_START_ President Obama” ส่งกลับเฉพาะประโยคที่ เริ่มต้น ด้วยวลี “ประธานาธิบดีโอบามา”)
  • _END_ บ่งชี้จุดสิ้นสุดของประโยค (“_ADP_ _END_” ส่งคืนประโยคที่ จบ ในคำบุพบท)

เมื่อรวมข้อความค้นหาเข้ากับตัวดำเนินการเลขคณิต คุณจะทำการวิเคราะห์ทางคณิตศาสตร์อย่างง่ายด้วยค่าความถี่ของคำได้:

  • + เพิ่มนิพจน์หลายคำในคำค้นหาเดียว
  • ลบนิพจน์ทางด้านขวาออกจากนิพจน์ทางด้านซ้าย เป็นวิธีที่รวดเร็วในการเปรียบเทียบการใช้คำค้นหาสองคำที่เกี่ยวข้องกัน
  • / แบ่งนิพจน์ทางด้านซ้ายโดยนิพจน์ทางด้านขวา
  • * คูณนิพจน์เพื่อเปรียบเทียบ ngrams ของความถี่ที่หลากหลาย ตรวจสอบให้แน่ใจว่าได้ใส่ ngram ทั้งหมดไว้ในวงเล็บเพื่อหลีกเลี่ยงไม่ให้มีการแยกวิเคราะห์เครื่องหมายดอกจันเป็นอักขระตัวแทน
  • : (โคลอน) ค้นหา ngram ทางด้านซ้ายภายใน corpus ทางด้านขวา

สุดท้าย คุณสามารถตั้งค่าการพึ่งพาด้วย “=>” เพื่อค้นหาความสัมพันธ์ทางภาษาได้

วิธีใช้ Google Ngram อย่างมีประสิทธิภาพมากขึ้น

ตัวอย่างเช่น "car=>fast" จะแสดงผลลัพธ์โดยที่ "fast" ขึ้นอยู่กับไวยากรณ์หรือการปรับเปลี่ยนคำว่า "car" ซึ่งสามารถผสมได้อย่างอิสระกับการดำเนินการค้นหาขั้นสูงใดๆ

บทสรุป

การค้นหาแนวโน้มคำศัพท์มีแอปพลิเคชั่นทางวิชาการมากมาย วิธีที่รวดเร็วในการค้นหาข้อมูลที่คุณต้องการคือเครื่องมือ Ngram ของ Google ข่าวดีก็คือมันไม่เพียงแต่ให้คุณทำการค้นหาพื้นฐานเท่านั้น คุณสามารถใช้ตัวปรับแต่งที่มีประสิทธิภาพเพื่อปรับแต่งข้อมูลที่คุณต้องการได้

ฟังก์ชันการทำงานของ Google Ngram จะไม่เกิดขึ้นหากไม่มีเสียงฮึดฮัดขั้นสูงของเครื่องมือค้นหาภายใต้ประทุน คุณประทับใจกับสิ่งที่เครื่องมือ Google Ngram สามารถทำได้หรือไม่? แจ้งให้เราทราบในส่วนความคิดเห็นด้านล่าง!