RSS

ทำไมปัญหาบนตึก CAT ถึงทำให้ระบบ Internet ทั้งประเทศไทยมีปัญหา (ThaiNews)

02 Dec

inetmap102013_domestic

อาคาร กสท บางรัก (อาคาร 30 ชั้นติดริมแม่น้ำเจ้าพระยา) เป็นอาคารโทรคมนาคม และเครือข่ายที่ใหญ่ที่สุดในประเทศไทย ภายในประกอบด้วย

    บริษัท Internet Data Center เปิดพื้นที่ให้บริการรับฝากวางเครื่องเซิร์ฟเวอร์ และให้บริการเชื่อมต่อโครงข่ายอินเทอร์เน็ตไปพร้อมๆ กัน
    ศูนย์แลกเปลี่ยนเส้นทางอินเทอร์เน็ตภายในประเทศไทยหลัก ของ กสท (CAT NIX)
    ศูนย์แลกเปลี่ยนเส้นทางอินเทอร์เน็ตต่างประเทศหลัก ของ กสท (CAT THIX หรือเรียกอีกชื่อว่า IIG)
    ระบบการเชื่อมต่อการสื่อสารผ่านสายใยแก้วนำแสง (fiber optic) ของบริษัทโทรคมนาคม (ทั้งอินเทอร์เน็ต โทรศัพท์ และโทรศัพท์มือถือ) เกือบทุกรายในประเทศ
    มหาวิทยาลัย ศูนย์การศึกษา สำนักงาน และส่วนพื้นที่ให้เช่าอื่นๆ (มีกระทั่งถ่ายทำละครในอาคารนี้ด้วยนะ!)

อาคารมีระบบสาธารณูปโภคพื้นฐานครบครันสำหรับการเปิดให้บริการศูนย์ข้อมูลระดับ 4 อยู่แล้ว ซึ่งมีข้อบังคับว่าจะต้องมี

    ระบบไฟฟ้าหลัก จากอย่างน้อย 2 โรงไฟฟ้า
    ระบบสำรองไฟฟ้า (UPS)
    เครื่องปั่นไฟฟ้า
    ระบบเชื่อมต่อเครือข่ายหลายเส้นทาง (Multiple uplinks) ผ่านสายเคเบิลใยแก้วนำแสง (Fiber optic cable) — จากข้อมูลที่มี มีสายไฟเบอร์ลากมาที่ตึกนี้ไม่ต่ำกว่า 50 เส้น (ตัวเลขเป๊ะๆ ไม่เปิดเผย)

ในการนี้ก็มีผู้ให้บริการภายนอก ที่เชื่อมต่อผ่านมายัง CAT NIX/IIG ทั้งสองรายอยู่พอสมควร (ดูข้อมูลได้จาก แผนภาพอินเทอร์เน็ตประเทศไทย) โดยมีการเชื่อมต่อภายนอกที่สำคัญๆ ประมาณนี้ครับ (ข้อมูลเมื่อวันที่ 7 พฤศจิกายนที่ผ่านมาครับ)

    ทรูอินเทอร์เน็ต เชื่อมต่อหา IIG 58.5Gbps (50%) ใช้เป็นเส้นทางหลักสำหรับให้บริการลูกค้าตามบ้านทั่วไป
    Proen เชื่อมต่อไป TOT-NIX 10Gbps, TIG-DIX 5Gbps
    Otaro เชื่อมต่อไป ทรูอินเทอร์เน็ต 10Gbps, TOT-NIX 20Gbps
    ISSP เชื่อมต่อไป TIG-DIX 4Gbps
    ISPIO เชื่อมต่อไป TIG-DIX 10Gbps, TOT-NIX 40Gbps

ข้อสังเกตใหญ่มากคือ ISP หลายรายไม่มีการเชื่อมต่อหากันโดยตรง หรือผ่านบริการ NIX รายอื่นเลย แม้กระทั่ง 3 เครือข่ายใหญ่ที่สุดอย่าง 3BB TOT หรือทรูอินเทอร์เน็ตก็ตาม ต่างก็ใช้การเชื่อมต่อผ่าน CAT NIX ในการรับส่งข้อมูลระหว่างกันทั้งสิ้น (3BB กับทรูอินเทอร์เน็ตมีการเชื่อมต่อผ่าน Jastel IX แต่ไม่มีบนแผนที่อินเทอร์เน็ต)

n4m8cภาพตัวอย่างการส่งข้อมูลจากทรูอินเทอร์เน็ต ไปยังเครือข่ายของ TOT

qq7ic
ภาพตัวอย่างการส่งข้อมูลจาก 3BB ไปยังเครือข่ายของ TOT

ส่วนการเชื่อมต่อภายในตึก เนื่องจากมีผู้ให้บริการศูนย์ข้อมูลอยู่หลายราย ทำให้แต่ละรายก็มีวิธี รูปแบบ ความจุ และความสามารถในการให้บริการแตกต่างกันออกไปแล้วแต่ผู้ให้บริการครับ

เมื่ออาคารนี้เป็นศูนย์รวมการเชื่อมต่อทั้งภายในประเทศและต่างประเทศ ทำให้เว็บไซต์ชื่อดังเป็นจำนวนมากเลือกที่จะเช่าพื้นที่วางเครื่องเซิร์ฟเวอร์ เพื่อให้ผู้ใช้งานสามารถเข้าใช้งานได้เร็วที่สุด เช่น dek-d.com, manager.co.th, voicetv.co.th รวมถึงระบบโทรคมนาคมของเครือข่ายโทรศัพท์มือถือหลายๆ เจ้า และระบบเครือข่ายอินเทอร์เน็ตของ CAT เองด้วย

ในสภาวะปกติทางอาคารมีการเตรียมพร้อมรับมือภัยพิบัติต่างๆ เช่น น้ำท่วม ไฟไหม้ หรือแม้กระทั่งเหตุการณ์อย่างสายไฟเบอร์ถูกตัด ตามมาตรฐานของศูนย์ข้อมูลชั้นนำทั่วไปอยู่แล้วครับ ซึ่งที่ผ่านมา (ไม่นับเหตุการณ์ที่บาง ISP ล่มเอง) ตัวอาคารเองก็ถือว่าสามารถให้บริการได้ตามมาตรฐานที่ควรจะเป็น แต่คงไม่ใช่เหตุการณ์ที่ “เครื่องปั่นไฟฟ้าถูกถอดวงจรแผงควบคุม” แน่นอน เมื่อกระแสไฟฟ้าถูกตัด ไฟฟ้าสำรองก็อยู่ได้ไม่นาน เครื่องปั่นไฟทำงานไม่ได้ ก็ทำให้อุปกรณ์ทั้งหมดดับลงไปครับ ส่วนผลกระทบที่เกิดขึ้นก็ประมาณนี้ครับ

    ระบบอินเทอร์เน็ตภายในประเทศผ่าน CAT NIX ใช้การไม่ได้ทั้งหมด (ข้อมูลจาก ISP อื่น เส้นทางที่วิ่งไปหา NIX หายจากอินเทอร์เน็ตไปเลย 100%)
    ระบบอินเทอร์เน็ตออกต่างประเทศผ่าน CAT IIG ใช้การไม่ได้เกือบทั้งหมด (ตรวจสอบจาก ISP ต่างประเทศยังเหลือเส้นทางอยู่พอสมควร)
        ช่องทางออกต่างประเทศของทรูอินเทอร์เน็ตตามบ้านก็ใช้การไม่ได้ไปด้วยบางส่วน ทำให้หลายๆ คนเข้าใช้งานเว็บไซต์ต่างประเทศไม่ได้ไปพักใหญ่ๆ
    อินเทอร์เน็ตของ CAT ล่มทั้งประเทศ (ระบบหลักอยู่ที่นี่)
    บริการโทรศัพท์มือถือ my by cat ล่มเป็นวงกว้าง (น่าจะทั้งประเทศ), Truemove-H ล่มหลายพื้นที่ (เข้าใจว่ามีระบบสำคัญๆ บางอย่างที่เชื่อมต่อมาจาก CAT)
    ศูนย์ข้อมูลที่อยู่ภายในอาคารทั้งหมดไม่สามารถให้บริการได้
    เว็บไซต์จำนวนมาก (ตัวเลขประมาณการโดยผู้เขียนคือระดับหลักหมื่น) รวมถึงบริการบนอินเทอร์เน็ตอื่นๆ ที่อยู่ภายในอาคารไม่สามารถใช้งานได้โดยสิ้นเชิง
    บริการ CDN ของเว็บไซต์ต่างประเทศหลายตัวไม่สามารถเข้าใช้งานได้ เนื่องจากพึ่งการส่งเส้นทางรับส่งข้อมูลบนอินเทอร์เน็ต และมีการจำกัดเครือข่ายที่เข้าใช้งานไว้ แต่เส้นทางเปลี่ยนจนเกิดการส่งไปยังเครื่องเซิร์ฟเวอร์ที่อยู่เครือข่ายอื่นที่ไม่ได้ตั้งค่ารับการเชื่อมต่อไว้
    การสื่อสารข้ามเครือข่ายบางส่วน (เช่น TOT กับ 3BB , TOT กับ True) ต้องวิ่งผ่านเส้นทางต่างประเทศทำให้ใช้งานได้ช้าลง หรือไม่สามารถเชื่อมต่อกันได้เลย
    หลังจากไฟฟ้ากลับมาปกติ พบว่ามีอุปกรณ์บางส่วนชำรุดเสียหาย ทำให้เสียเวลาซ่อมแซมและเปลี่ยนอุปกรณ์นานขึ้นไปอีก

ส่วนที่ไม่ได้รับผลกระทบ หรือได้รับผลกระทบน้อยมากมีประมาณนี้ครับ

    การใช้งานเว็บไซต์ต่างประเทศจากอินเทอร์เน็ตอื่นที่ไม่ใช่ทรู
    สำหรับผู้ให้บริการโทรศัพท์มือถือค่ายอื่นๆ
        AIS ใช้โครงข่ายหลักของ SBN ที่เชื่อมต่อหาทุก IX อยู่แล้ว
        Dtac มีการเชื่อมต่อสำรองผ่าน CSLoxinfo IX ที่ก็เชื่อมต่อครบทุก IX เช่นกัน
    การใช้งานเว็บไซต์ที่มีโครงข่ายเป็นของตัวเอง หรืออยู่กับผู้ให้บริการรายอื่นที่มีการเชื่อมต่อหลายเส้นทาง ไม่ได้อยู่ในอาคารนี้ และไม่ได้ต้องเรียกใช้ข้อมูลจากเครื่องที่อยู่ภายในอาคาร

ทิ้งท้ายกันด้วยสิ่งที่ควรปรับปรุงหลังจากนี้ คือมาตรการรักษาความปลอดภัยเชิงกายภาพของระบบสาธารณูปโภคสำคัญสำหรับการให้บริการศูนย์ข้อมูล ไม่ควรให้ใครเข้ามาตัดระบบได้ง่ายๆ แบบครั้งนี้ครับ  ที่มา :: blognone

 
Leave a comment

Posted by on 02/12/2013 in IT

 

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

 
%d bloggers like this: