ตั้งคำถามที่ตนเองสนใจ ? อะไร(What) ที่ไหน(Where) เมื่อไร(When) ทำไม(Why) ใคร(Who) อย่างไร(How) เป็นต้น
ต้องคำนึงถึงว่าจะเก็บข้อมูลเรื่องอะไร จากที่ไหน จำนวนเท่าใด และความน่าเชื่อถือของแหล่งข้อมูล ข้อมูลที่เก็บรวบรวมได้จะต้องทำการตรวจสอบ ขจัดข้อมูลที่ผิด หรือข้อมูลที่ไม่สมบูรณ์ เพื่อให้ได้ข้อมูลนำเข้าที่ดี ไปสู่ผลลัพธ์ที่ดี เหมือนกับประโยคที่ว่า "garbage in garbage out"
เป็นการทำความเข้าใจรูปแบบ และค่าของข้อมูล ในขั้นตอนนี้เราจะต้องรวบรวมข้อมูล แล้วนำข้อมูลที่รวบรวมมาพล็อต (plot) ทำให้เป็นภาพ (visualizations) หรือแผนภูมิ (charts) เพื่อให้มองเห็นความหมายที่ซ่อนเร้นอยู่ของข้อมูลผ่านกราฟ ซึ่งอาจพบความผิดปกติของข้อมูลได้
การวิเคราะห์ข้อมูล เป็นการดำเนินการกับข้อมูล เพื่อให้เกิดความเข้าใจข้อมูลเชิงลึกในสิ่งที่สนใจศึกษา โดยผลลัพธ์ของการวิเคราะห์ข้อมูลสามารถนำไปประกอบการตัดสินใจเพื่อให้เกิดประโยชน์สูงสุดต่อการดำเนินการของบุคคลหรือองค์กร
เป็นการสื่อสารผลลัพธ์ของข้อมูล โดยการถ่ายทอดเป็นเรื่องราว หรือเป็นภาพให้ผู้อื่นเข้าใจว่าเราได้เรียนรู้อะไรจากข้อมูล