วิธีการใช้คําสั่งปรับแต่งหรือหมุนกราฟแบบ 3 มิติ คือ

แปล Data Visualization fundamental Claus O. Wilke

กราฟ 3 มิติ เป็นที่นิยมอย่างสูงในการนำเสนอทางธุรกิจ แต่ในหมู่นักวิชาการกลับไม่เป็นเช่นนั้นอะไรทำใมเหล่านักวิชาการไม่ใช้กราฟ 3 มิติในบทนี้เราจะมาพูดถึงเหตุผลในเรื่องนี้

26.1 ไม่ควรใช้กราฟ 3 มิติ

ซอฟต์แวร์การแสดงกราฟจากข้อมูลหลายโปรแกรมสามารถแปลงกราฟโดยเปลี่ยนองค์ประกอบกราฟิกของกราฟให้เป็นวัตถุสามมิติ โดยทั่วไปเราจะเห็นแผนภูมิวงกลมกลายเป็นดิสก์หมุนในพื้นที่แปลงบาร์กลายเป็นคอลัมน์และแปลงเส้นกลายเป็นแถบ โดยเฉพาะอย่างยิ่งในกรณีเหล่านี้มิติที่สามจะนำเสนอข้อมูลจริงใด ๆ ในรูปแบบ 3 มิติ มันแย่มากและควรลบออกจากคำศัพท์ของนักวิทยาศาสตร์ข้อมูล

ปัญหาเกี่ยวกับกราฟ 3 มิติ คือการฉายภาพวัตถุสามมิติเป็นสองมิติทำให้บิดเบือนข้อมูล ระบบการมองเห็นของมนุษย์พยายามที่จะแก้ไขความผิดเพี้ยนนี้เนื่องจากจะจับคู่ ภาพ 2 มิติกับภาพ 3 มิติกลับสู่ 3 มิติ อย่างไรก็ตามการแก้ไขนี้สามารถทำได้เพียงบางส่วนเท่านั้น ยกตัวอย่างเช่นลองทำแผนภูมิวงกลมอย่างง่ายที่มีสองส่วนหนึ่งอันแสดงถึง 25% ของข้อมูลและอีก 75% และหมุนวงกลมนี้(รูปที่ 26.1) ในขณะที่เราเปลี่ยนมุมที่เรากำลังดูพายขนาดของชิ้นดูเหมือนจะเปลี่ยนเช่นกัน โดยเฉพาะอย่างยิ่งชิ้น 25% ซึ่งอยู่ด้านหน้าของวงกลมนั้นมีขนาดใหญ่กว่า 25% เมื่อเราดูที่มุมจากมุมฉาก (รูปที่ 26.1a)

Figure 26.1: The same 3D pie chart shown from four different angles. Rotating a pie into the third dimension makes pie slices in the front appear larger than they really are and pie slices in the back appear smaller. Here, in parts (a), (b), and ©, the blue slice corresponding to 25% of the data visually occupies more than 25% of the area representing the pie. Only part (d) is an accurate representation of the data.

ปัญหาที่คล้ายกันเกิดขึ้นสำหรับกราฟ 3มิติ ประเภทอื่น รูปที่ 26.2 แสดงรายละเอียดของผู้โดยสารเรือไททานิคตามชั้นโดยสารและเพศโดยใช้บาร์ 3 มิติ เนื่องจากวิธีการจัดเรียงแท่งเทียบกับแกนแท่งจึงดูสั้นกว่าที่เป็นจริง ตัวอย่างเช่นมีผู้โดยสารทั้งหมด 322 คนที่เดินทางในชั้นที่ 1 แต่รูปที่ 26.2 แสดงให้เห็นว่าจำนวนนั้นน้อยกว่า 300 ภาพลวงตานี้เกิดขึ้นเนื่องจากคอลัมน์ที่เป็นตัวแทนของข้อมูลอยู่ห่างจากด้านหลังทั้งสองซึ่งเส้นสีเทาแนวนอน จะถูกวาด หากต้องการดูเอฟเฟกต์นี้ให้ลองขยายขอบด้านล่างของคอลัมน์ใดคอลัมน์หนึ่งจนมองเห็นเส้นสีเทาต่ำสุดซึ่งแสดงถึง 0 จากนั้นลองจินตนาการถึงการทำแบบเดียวกันกับขอบด้านบนใด ๆ และคุณจะเห็นว่าคอลัมน์ทั้งหมด สูงกว่าที่ปรากฏในแวบแรก (ดูรูปที่ 6.10 ในบทที่ 6 สำหรับรูปแบบ 2D ที่สมเหตุสมผลมากขึ้นของรูปนี้)

Figure 26.2: Numbers of female and male passengers on the Titanic traveling in 1st, 2nd, and 3rd class, shown as a 3D stacked bar plot. The total numbers of passengers in 1st, 2nd, and 3rd class are 322, 279, and 711, respectively (see Figure 6.10). Yet in this plot, the 1st class bar appears to represent fewer than 300 passengers, the 3rd class bar appears to represent fewer than 700 passengers, and the 2nd class bar seems to be closer to 210–220 passengers than the actual 279 passengers. Furthermore, the 3rd class bar visually dominates the figure and makes the number of passengers in 3rd class appear larger than it actually is.

26.2 กราฟ 3 มิติทำให้ขนาดของสัดส่วนผิดเพี้ยน

การสร้างกราฟ 3 มิติ โดยทั่วไปง่ายต่อการทำให้เข้าใจผิด มันทำให้ความจัดเจนในการแสดงข้อมูลลดลงในตำแหน่งของแกน X และ Y หรือ Z ในกรณีถ้าเราต้องการแสดงข้อมูลสามมิติมันยากที่จะหลีกเลี่ยงปัญหานี้สิ่งเดี่ยวที่ทำได้คือคิดเสมอว่าควรระวัง

พิจารณา scatter plot 3 มิติ ที่แสดงถึงน้ำมันเชื้อเพลิง เปรียบเทียบกับระยะทางสำหรับรถยนต์ 32 คัน เราได้เห็นชุดข้อมูลนี้ก่อนหน้านี้ในบทที่ 2 รูปที่ 2.5 ที่นี่เราวางแผนการเคลื่อนที่ตามแนวแกน x กำลังตามแกน y และประสิทธิภาพการใช้เชื้อเพลิงตามแนวแกน z และเราเป็นตัวแทนของรถยนต์แต่ละคันด้วยจุด (รูปที่ 26.3) แม้ว่าการสร้างภาพสามมิตินี้แสดงจากมุมมองที่แตกต่างกันสี่มุมมอง แต่ก็เป็นการยากที่จะจินตนาการว่าการกระจายจุดในช่องว่างเป็นอย่างไร พบว่าบางส่วน (d) ของรูปที่ 26.3 โดยเฉพาะอย่างยิ่งทำให้เกิดความสับสน มันเกือบจะแสดงชุดข้อมูลที่แตกต่างกันแม้ว่าจะไม่มีอะไรเปลี่ยนแปลงนอกจากมุมที่เรามองจุดต่างๆ

Figure 26.3: Fuel efficiency versus displacement and power for 32 cars (1973–74 models). Each dot represents one car, and the dot color represents the number of cylinders of the car. The four panels (a)–(d) show exactly the same data but use different perspectives. Data source: Motor Trend, 1974.

ปัญหาพื้นฐานของการสร้างภาพสามมิติอาจแก้ไขได้โดยแสดงข้อมูลออกเป็นสองกราฟต่อเนื่องกัน กราฟแรกแสดงข้อมูลดังที่ได้กล่าวไว้ในบทที่ 2 และ 3 ในบริบทของการปรับตำแหน่ง กราฟที่สองจับคู่ข้อมูลจากพื้นที่การสร้างภาพ 3 มิติลงในพื้นที่ 2D ของรูปสุดท้าย (กราฟที่สองนี้ไม่ได้เกิดขึ้นสำหรับการสร้างภาพที่แสดงในสภาพแวดล้อม 3 มิติจริงเช่นเมื่อแสดงเป็นรูปปั้นทางกายภาพหรือวัตถุที่พิมพ์ด้วย 3Dการสร้างภาพ 3 มิติที่แสดงบนจอแสดงผล 2 มิติ) กลับด้านได้เนื่องจากแต่ละจุดบนจอแสดงผล 2D สอดคล้องกับบรรทัดของจุดในพื้นที่การสร้างภาพ 3 มิติ ดังนั้นเราจึงไม่สามารถกำหนดได้ว่าจุดข้อมูลใดอยู่ในพื้นที่ 3D โดยเฉพาะ

ระบบการรับรู้ของเรายังพยายามแปลงกราฟ 3D เป็น 2D อย่างไรก็ตามกระบวนการนี้ไม่น่าเชื่อถือเต็มไปด้วยข้อผิดพลาดและขึ้นอยู่กับตัวชี้นำที่เหมาะสมในภาพที่ถ่ายทอดความรู้สึกสามมิติบางอย่าง เมื่อเราลบตัวชี้นำเหล่านี้การผกผันจะเป็นไปไม่ได้อย่างสิ้นเชิง สามารถดูได้ในรูปที่ 26.4 ซึ่งเหมือนกับรูปที่ 26.3 ยกเว้นความหมายทั้งหมดได้ถูกลบออก ผลที่ได้คือการจัดเรียงคะแนนแบบสุ่มสี่จุดที่เราไม่สามารถตีความได้เลยและไม่สามารถสัมพันธ์กันได้อย่างง่ายดาย เราสามารถบอกได้ว่าจุดใดในส่วน (a) สอดคล้องกับจุดใดในส่วน (b) แน่นอนฉันไม่สามารถ

Figure 26.4: Fuel efficiency versus displacement and power for 32 cars (1973–74 models). The four panels (a)–(d) correspond to the same panels in Figure 26.3, only that all grid lines providing depth cues have been removed. Data source: Motor Trend, 1974.

แทนที่จะใช้การแปลงข้อมูลสองแบบแยกกันซึ่งหนึ่งในนั้นไม่สามารถย้อนกลับได้ จะดีกว่าที่จะใช้กราฟที่เหมาะสมกลับด้านที่เหมาะสมและแมปข้อมูลลงในพื้นที่ 2D โดยตรง ไม่จำเป็นต้องเพิ่มมิติที่สามเป็นสเกลตำแหน่งเนื่องจากตัวแปรยังสามารถสร้างลงในสีขนาดหรือสเกลรูปร่างได้ ตัวอย่างเช่นในบทที่ 2ตัวแปรห้าชุดของชุดข้อมูลประสิทธิภาพการใช้เชื้อเพลิงในครั้งเดียว แต่ใช้เพียงสองระดับตำแหน่งเท่านั้น (รูปที่ 2.5)

ก่อนอื่นถ้าเราใส่ใจเกี่ยวกับประสิทธิภาพการใช้เชื้อเพลิงเป็นหลักเป็นตัวแปรตอบสนองเราสามารถพล็อตมันสองครั้งครั้งหนึ่งต่อการกำจัดและต่อพลังงาน (รูปที่ 26.5) ประการที่สองหากเราสนใจว่าการกระจัดและพลังงานสัมพันธ์กันอย่างไรด้วยประสิทธิภาพการใช้เชื้อเพลิงในฐานะตัวแปรรองที่น่าสนใจเราสามารถวางแผนพลังงานกับการกำจัดและแผนที่ประสิทธิภาพการใช้เชื้อเพลิงตามขนาดของจุด (รูปที่ 26.6) ตัวเลขทั้งสองมีประโยชน์มากกว่าและสับสนน้อยกว่ารูปที่ 26.3

Figure 26.5: Fuel efficiency versus displacement (a) and power (b). Data source: Motor Trend, 1974.Figure 26.6: Power versus displacement for 32 cars, with fuel efficiency represented by dot size. Data source: Motor Trend, 1974.

ปัญหาเกี่ยวกับแผนการกระจายแบบสามมิติคือการแสดงข้อมูลจริงจุดต่าง ๆ ไม่ได้แสดงข้อมูล 3 มิติด้วยตนเอง ตัวอย่างเช่นเกิดอะไรขึ้นถ้าเราใช้แถบ 3D แทน? รูปที่ 26.7 แสดงชุดข้อมูลทั่วไปที่หนึ่งอาจเห็นภาพด้วยแถบ 3 มิติอัตราการเสียชีวิตในปี 1940 ในเวอร์จิเนียแบ่งชั้นตามกลุ่มอายุและตามเพศและที่อยู่อาศัย เราจะเห็นได้ว่าจริง ๆ แล้วแถบ 3 มิติช่วยให้เราตีความพล็อต มันไม่น่าเป็นไปได้ที่คน ๆ หนึ่งจะเข้าใจผิดว่าแถบที่อยู่เบื้องหน้านั้นมีแถบที่อยู่ด้านหลังหรือในทางกลับกัน อย่างไรก็ตามปัญหาที่กล่าวถึงในบริบทของรูปที่ 26.2 มีอยู่ที่นี่เช่นกัน เป็นการยากที่จะตัดสินว่าแต่ละแท่งสูงเท่าไรและเป็นการยากที่จะทำการเปรียบเทียบโดยตรง ตัวอย่างเช่นอัตราการตายของผู้หญิงในเมืองในกลุ่มอายุ 65–69 ปีสูงกว่าหรือต่ำกว่าเพศชายในเมืองในกลุ่มอายุ 60–64 ปีหรือไม่

Figure 26.7: Mortality rates in Virginia in 1940, visualized as a 3D bar plot. Mortality rates are shown for four groups of people (urban and rural females and males) and five age categories (50–54, 55–59, 60–64, 65–69, 70–74), and they are reported in units of deaths per 1000 persons. This figure is labeled as “bad” because the 3D perspective makes the plot difficult to read. Data source: Molyneaux, Gilliam, and Florant (1947)

โดยทั่วไปจะดีกว่าถ้าใช้ Trellis (บทที่ 21) แทนการสร้างภาพ 3 มิติ ชุดข้อมูลการตายในเวอร์จิเนียต้องการเพียงสี่พาเนลเมื่อแสดงเป็นพล็อต Trellis (รูปที่ 26.8) ตัวเลขนี้ชัดเจนและง่ายต่อการตีความ เป็นที่ชัดเจนในทันทีว่าอัตราการตายสูงกว่าในผู้ชายมากกว่าผู้หญิงและผู้ชายในเขตเมืองก็ดูเหมือนว่าจะมีอัตราการตายสูงกว่าผู้ชายในชนบท แต่ไม่มีแนวโน้มดังกล่าวสำหรับผู้หญิงในเมืองและในชนบท

Figure 26.8: Mortality rates in Virginia in 1940, visualized as a Trellis plot. Mortality rates are shown for four groups of people (urban and rural females and males) and five age categories (50–54, 55–59, 60–64, 65–69, 70–74), and they are reported in units of deaths per 1000 persons. Data source: Molyneaux, Gilliam, and Florant (1947)

26.3 การใช้กราฟสามมิติที่เหมาะสม

อย่างไรก็ตามการแสดงภาพด้วย 3D บางครั้งอาจเหมาะสม ก่อนอื่นปัญหาที่อธิบายในส่วนก่อนหน้านี้มีความกังวลน้อยกว่าหากการสร้างภาพข้อมูลเป็นแบบโต้ตอบและสามารถหมุนได้โดยผู้ชมหรืออีกทางเลือกหนึ่งหากแสดงใน VR หรือสภาพแวดล้อมความเป็นจริงที่สามารถตรวจสอบได้จากหลายมุม ประการที่สองแม้ว่าการสร้างภาพข้อมูลไม่ได้เป็นแบบโต้ตอบแสดงให้เห็นว่าการหมุนช้าๆแทนที่จะเป็นภาพนิ่งจากมุมมองเดียวจะช่วยให้ผู้ชมมองเห็นว่าในพื้นที่ 3 มิติมีองค์ประกอบกราฟิกที่แตกต่างกันอยู่ สมองมนุษย์ดีมากในการสร้างฉาก 3 มิติใหม่จากชุดภาพที่ถ่ายจากมุมที่แตกต่างกันและการหมุนภาพช้าๆของภาพทำให้ได้ภาพเหล่านี้อย่างแน่นอน

มันดูสมเหตุสมผลที่จะใช้การสร้างภาพ 3 มิติเมื่อเราต้องการแสดงวัตถุ 3 มิติที่แท้จริงและ / หรือข้อมูลที่แมปไว้ ตัวอย่างเช่นการแสดงความโล่งอกภูมิประเทศของเกาะภูเขาเป็นตัวเลือกที่สมเหตุสมผล (รูปที่ 26.9) ในทำนองเดียวกันถ้าเราต้องการเห็นภาพการอนุรักษ์ลำดับวิวัฒนาการของโปรตีนที่แมปไว้บนโครงสร้างของมันมันก็สมเหตุสมผลที่จะแสดงโครงสร้างเป็นวัตถุ 3 มิติ (รูปที่ 26.10) อย่างไรก็ตามในทั้งสองกรณีการสร้างภาพข้อมูลเหล่านี้ยังคงง่ายต่อการตีความหากแสดงเป็นภาพเคลื่อนไหวแบบหมุน แม้ว่าสิ่งนี้จะเป็นไปไม่ได้ในสิ่งพิมพ์สิ่งพิมพ์แบบดั้งเดิม แต่ก็สามารถทำได้อย่างง่ายดายเมื่อโพสต์ตัวเลขบนเว็บหรือเมื่อมีการนำเสนอ

Figure 26.9: Relief of the Island of Corsica in the Mediterranean Sea. Data source: Copernicus Land Monitoring ServiceFigure 26.10: Patterns of evolutionary variation in a protein. The colored tube represents the backbone of the protein Exonuclease III from the bacterium Escherichia coli (Protein Data Bank identifier: 1AKO). The coloring indicates the evolutionary conservation of the individual sites in this protein, with dark coloring indicating conserved amino acids and light coloring indicating variable amino acids. Data source: Marcos and Echave (2015)

References

Molyneaux, L., S. K. Gilliam, and L. C. Florant. 1947. “Differences in Virginia Death Rates by Color, Sex, Age, and Rural or Urban Residence.” American Sociological Review 12: 525–35.

Marcos, M. L., and J. Echave. 2015. “Too Packed to Change: Side-Chain Packing and Site-Specific Substitution Rates in Protein Evolution.” PeerJ 3: e911.

อ่านบทอื่นๆได้ที่

1. บทนำ​Data Visualization

2 .Visualizing data: การเเสดงข้อมูลอย่างมีศิลปะ

3 การแสดงข้อมูลในรูปพิกัดและแกน

4. การใช้สีเพื่อแสดงข้อมูล

5 Directory of visualizations

6. การแสดงค่าข้อมูล

7 การแสดงการแจกแจง: ฮิสโตแกรมและ density plots

8 การแสดงภาพการแจกแจง: ฟังก์ชันการแจกแปล แจงสะสมเชิงประจักษ์และq-q Plots

9 -การแสดงข้อมูลหลายตัวแปลในรูปเดี่ยว

10 การแสดงข้อมูลในรูปสัดส่วน

11 การแสดงสัดส่วนข้อมูลที่ซ้อนกัน

12 การแสดงข้อมูลโดยเชื่อมโยงระหว่างตัวแปรเชิงปริมาณตั้งแต่สองตัวขึ้นไป

13 การแสดงข้อมูลอนุกรมเวลาและฟังก์ชั่นของตัวแปรอิสระ

14 การแสดงแนวโน้ม

15 การแสดงข้อมูลเชิงภูมิศาสตร์

16 การแสดงการกระจายของข้อมูล

17 หลักการแสดงข้อมูลที่เป็นสัดส่วน

18 การจัดการข้อมูลที่ซ้อนกันในการแสดงข้อมูล

19 ข้อผิดพลาดที่พบได้บ่อยเมื่อใช้สีแสดงข้อมูล

20 การแสดงข้อมูลที่ซ้อนกัน

21 การแสดงข้อมูลหลายกราฟในรูปเดียว

22 ชื่อเรื่อง Captions และตาราง

23 การสร้างสมดุลระหว่างข้อมูลและบริบทแวดล้อมในการแสดงข้อมูล

24 การใช้ labels ที่มีขนาดใหญ่

25 หลีกเลียงการใช้เส้นในการสร้างกราฟ

26 อย่าใช้กราฟ 3 มิติ

27 ทำความเข้าใจกับชนิดไฟล์ที่ใช้บ่อยในงานแสดงข้อมูล

28. การเลือกซอฟต์แวร์สร้างภาพข้อมูลที่ถูกต้อง