Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

ตัวแปรไบนารีคืออะไร?


ตัวแปรไบนารีมีเพียงสองสถานะเช่น 0 หรือ 1 โดยที่ 0 กำหนดว่าไม่มีตัวแปรและ 1 กำหนดว่ามีอยู่ เมื่อพิจารณาจากตัวแปรผู้สูบบุหรี่ที่กำหนดผู้ป่วย ตัวอย่างเช่น 1 แสดงว่าผู้ป่วยสูบบุหรี่ ในขณะที่ 0 แสดงว่าผู้ป่วยไม่สูบบุหรี่ การพิจารณาตัวแปรไบนารีเสมือนว่ามีการปรับขนาดตามช่วงเวลาสามารถนำไปสู่ผลลัพธ์การจัดกลุ่มที่ทำให้เข้าใจผิดได้ ดังนั้นเมธอดที่กำหนดข้อมูลไบนารีจึงมีความจำเป็นสำหรับการคำนวณความไม่เหมือนกัน

มีวิธีการหนึ่งที่เกี่ยวข้องกับการคำนวณเมทริกซ์ความต่างจากข้อมูลไบนารีที่ให้มา หากคิดว่าตัวแปรไบนารีบางตัวมีน้ำหนักใกล้เคียงกัน ก็สามารถมีตารางฉุกเฉินแบบ 2 ต่อ 2 โดยที่ q คือจำนวนตัวแปรที่คล้ายกับ 1 สำหรับทั้งวัตถุ i และ j โดยที่ r คือจำนวนตัวแปรที่ 1 เหมือนกันสำหรับวัตถุ i แต่ที่เป็น 0 สำหรับวัตถุ j, s คือจำนวนของตัวแปรที่เหมือนกัน 0 สำหรับวัตถุ i แต่คล้ายกับ 1 สำหรับวัตถุ j และ t คือจำนวนของตัวแปรที่คล้ายกับ 0 สำหรับวัตถุทั้งสอง i และเจ จำนวนตัวแปรทั้งหมดคือ p โดยที่ p =q+r +s+t

ตัวแปรไบนารีจะสมมาตรหากทั้งสองสถานะมีค่าเท่ากันและมีน้ำหนักเท่ากัน กล่าวคือ ไม่มีการตั้งค่าใดที่ผลลัพธ์จะต้องถูกเข้ารหัสเป็น 0 หรือ 1 ความแตกต่างที่ขึ้นอยู่กับตัวแปรไบนารีแบบสมมาตรเรียกว่าความต่างแบบไบนารีสมมาตร

ตัวแปรไบนารีจะไม่สมมาตรหากผลลัพธ์ของรัฐไม่สำคัญ รวมถึงผลบวกและลบของการทดสอบโรค ตามแบบแผน เราจะกำหนดผลลัพธ์ที่จำเป็น ซึ่งโดยทั่วไปแล้วจะเป็นผลลัพธ์ที่หายากที่สุด ทีละ 1 (เช่น ผลบวกของ HIV) และอีกรายการหนึ่งเป็น 0 (เช่น ผลลบของ HIV)

เมื่อพิจารณาจากตัวแปรไบนารีที่ไม่สมมาตรสองตัว การเกิดขึ้นพร้อมกันของ 1 วินาที (การจับคู่เชิงบวก) จะถือว่ามีความสำคัญมากกว่า 0 วินาที (การจับคู่เชิงลบ) ดังนั้น ตัวแปรไบนารีดังกล่าวจึงถือเป็น “monary” (ราวกับว่ามีสถานะเดียว)

ความแตกต่างที่อิงจากตัวแปรดังกล่าวเรียกว่า asymmetric binary dissimilarity โดยที่การจับคู่เชิงลบหลายรายการ t ถือว่าไม่สำคัญ ดังนั้นจึงถูกละเว้นในการคำนวณ ดังแสดงในสมการ

$$\mathrm{d(i, j)=\:\frac{r+s}{q+r+s}}$$

มันสามารถคำนวณระยะห่างระหว่างสองตัวแปรไบนารีขึ้นอยู่กับแนวคิดของความคล้ายคลึงกันมากกว่าความแตกต่าง ตัวอย่างเช่น ความคล้ายคลึงของไบนารีแบบอสมมาตรระหว่างอ็อบเจ็กต์ i และ j หรือ sim (i, j) สามารถคำนวณได้ดังนี้

$$\mathrm{sim(i, j)=\:\frac{q}{q+r+s}=1-d(i,j)}$$.

ค่าสัมประสิทธิ์ซิม (i, j) เรียกว่าสัมประสิทธิ์แจ็คการ์ด