หมายเลข ID หัวข้อ : 00138548 / ปรับปรุงครั้งล่าสุด : 11/04/2017

คู่มือเบื้องต้น A-Z เพื่อทำความเข้าใจกับระบบเสียงดิจิตอล

ผลิตภัณฑ์และหมวดสินค้าที่ใช้ได้กับหัวข้อนี้

สับสนกับบางส่วนของภาษาที่ใช้ในการอธิบายอุปกรณ์เสียงอยู่ใช่ไหม? จึงได้จัดทำคู่มือแนะนำอย่างง่ายสำหรับช่วยท่านให้เข้าใจได้ดียิ่งขึ้น.


ความรู้เบื้องต้น: วิธีการบันทึกเสียงแบบดิจิตอล

เสียงในโลกของความเป็นจริงมีการแปรผันอย่างต่อเนื่อง, การบันทึกแบบดิจิตอลเป็นค่าใกล้เคียงของเสียงแบบเต็มในโลก อย่างไรก็ตาม, ความก้าวหน้าของเทคโนโลยีการบันทึกยังคงมีการขยายไปอย่างต่อเนื่องในขอบเขตและความแม่นยำของการบันทึกแบบดิจิตอล.

เมื่อการบันทึกแบบดิจิตอลทำจากแหล่งสัญญาณอนาล็อก – เช่น การบันทึกการแสดงคอนเสิร์ต หรือของนักดนตรี ในห้องสตูดิโอบันทึกเสียง – เสียงจะได้รับการตรวจสอบเป็นตัวอย่าง (sample) ในช่วงระยะเวลาที่สม่ำเสมอ. ขนาดของเสียงจะได้รับการบันทึกเป็นตัวเลข, การบันทึกแบบดิจิตอลของแหล่งเสียงอนาล็อกจะเป็นอนุกรมของตัวเลขที่ไม่เกี่ยวข้องกัน.

การที่เสียงอนาล็อกต้นฉบับจะได้รับการแปลงไปได้มากเท่าใดในการบันทึกแบบดิจิตอลนั้นหลัก ๆ จะขึ้นอยู่กับ sampling rate และ bit depth (มีการตรวจสอบเป็นตัวอย่างมากเท่าใดใน 1 วินาที, และ มีข้อมูลมากเท่าใดในการสุ่มตัวอย่าง).

การบันทึกและจัดเก็บ

เมื่อทำการบันทึกแบบดิจิตอล, จะสามารถเก็บบันทึกในตัวเลขที่มีฟอร์แมทแตกต่างกัน. แต่ละฟอร์แมทจะมีวิธีการที่ต่างกันในการทำให้มีคุณภาพเสียงที่สมดุลย์ด้วยตามขนาดของไฟล์ดิจิตอลที่สร้างขึ้นมา: เช่น ยังไม่เคยพบว่าเสียงที่มีการบันทึกไว้ด้วยคุณภาพเสียงสูงสุด จะมีอยู่ในเครื่องเล่นเพลงขนาดเล็กได้ เป็นต้น.

แต่จากการที่หน่วยจัดเก็บดิจิตอลหาได้ง่ายสำหรับอุปกรณ์ดิจิตอลแบบพกพาที่มีการอ้างว่า มีพื้นที่จัดเก็บได้หลาย ๆ กิกะไบต์, จึงทำให้เสียงคุณภาพสูงมาก ๆ กลายเป็นความจริงขึ้นมาได้สำหรับผู้คนนับล้าน ๆ.

คู่มือเบื้องต้น A-Z สำหรับฟีเจอร์ต่าง ๆ ของเสียง

5.1ch
7.1ch
Analogue
Bit depth
Codec
Compression
Digital
Dolby Digital
Dolby True HD
DSD
DSEE HX
DTS Digital Surround
DTS Master Audio
DTS:X
Hi-Res Audio
LDAC
LFE
Lossless
Lossy
LPCM
S-Master HX
SA-CD
Sampling rate
SBCs
Subwoofer
Surround sound
Upscaling


5.1ch
ย่อมาจาก 5.1 channels, เป็นวิธีการที่จะให้ surround sound เพื่อให้มีบรรยากาศเหมือนอยู่ในโรงภาพยนตร์. จะมีลำโพงห้าตัว บวกกับลำโพง subwoofer 1 ตัว วางอยู่รอบ ๆ ผู้ฟัง, โดยที่ลำโพงแต่ละตัวจะรับแชลแนลสัญญาณเสียงแตกต่างกันดังนี้:

  1. แชลแนลหน้าสองตัว
  2. แชลแนลตรงกลางหน้าหนึ่งตัว
  3. แชลแนลเซอร์ราวด์สองตัว
  4. แชนแนล สร้างเอฟเฟคความถี่ต่ำ (LFE) หนึ่งตัว

ลำโพงซับวูฟเฟอร์นี้, จะรับสัญญาณแชลแนล LFE, ซึ่งสามารถวางที่ใดก็ได้ในบริเวณห้องนั้น. เมื่อเทียบกับระบบเสียงเซอร์ราวด์ที่ไม่มีลำโพงซับวูฟเฟอร์ ระบบนี้เป็นการประหยัดเนื้อที่ได้มากกว่า: เพราะเสียงความถี่ต่ำทั้งหมดจะถูกส่งไปออกที่ลำโพงซับวูฟเฟอร์ จึงทำให้ลำโพงตัวอื่น ๆ สามารถจะเป็นตัวเล็ก ๆ ได้ เพราะไม่จำเป็นต้องให้เสียงเบสออกมาด้วย. หรือเข้าไปดูที่ 7.1ch

7.1ch
A 7.1 ระบบ surround sound จะใช้ลำโพง 7 ตัวร่วมกับลำโพงซับวูฟเฟอร์อีก 1 ตัว จะคล้ายกับระบบ 5.1ch แต่จะมีการเพิ่มแชลแนล เซอร์ราวด์ด้านหลังเข้ามา.

Analogue
การบันทึกแบบอนาล็อกจะจัดเก็บเสียงต้นฉบับโดยสร้างความเปลี่ยนแปลงให้กับสื่อที่เป็นวัตถุที่จับต้องได้, เช่น แถบเทปแม่เหล็ก หรือแผ่นเสียงไวนิล. ซึ่งจะแตกต่างไปจากวิธีการที่ใช้ในการบันทึกแบบ digital.

Bit depth
ความลึกของบิตของการบันทึกแบบดิจิตอลจะเป็นการแสดงให้ทราบว่า ต้องใช้ตัวเลขจำนวนเท่าใดในการจัดเก็บของแต่ละการตรวจสอบตัวอย่างของสัญญาณอนาล็อก. ความลึกของบิตมาตรฐานสำหรับ CD audio คือ 16, โดยมี sampling rate ที่ 44.1kHz – หมายถึง มีการใช้ 44,100 ตัวอย่างในหนึ่งวินาที และแต่ละตัวอย่างจะเก็บบันทึกข้อมูลไว้ 16 บิต. โดยปกติ, ความลึกของบิตที่สูงขึ้น หมายถึง การมีเสียงที่คุณภาพสูงกว่าแต่จะมีขนาดของไฟล์ที่ใหญ่กว่าด้วย.

Hi-Res Audio มีความลึกของบิตอย่างน้อย 24 บิต, โดยจะมีอัตราการตรวจสอบตัวอย่างที่ 96kHz หรือสูงกว่า.

Codec
เมื่อเสียงมีการส่งผ่านในรูปแบบดิจิตอลไปให้กับ ตัวเข้ารหัส/ถอดรหัส (coder / decoder), หรือย่อเป็น codec. สิ่งนี้จะเป็นซอฟต์แวร์หรือฮาร์ดแวร์อันหนึ่งที่จะรับเอาสัญญาณเสียงอนาล็อกเข้ามาและ codes ให้ไปอยู่ในรูปแบบดิจิตอลที่สามารถจัดเก็บไว้ในรูปแบบอิเล็กทรอนิกส์ได้. เมื่อเสียงได้รับการเล่น, codec จะทำการถอดรหัสไฟล์ดิจิตอลนั้นเพื่อสร้างเสียงออกมา.

ในแต่ละตัว เข้ารหัส/ถอดรหัสเสียง จะใช้วิธีการที่แตกต่างกันเพื่อทำการเข้ารหัสสัญญาณอนาล็อก, จึงมีจุดเด่นและจุดด้อยที่แตกต่างกันในการจัดเก็บและสร้างเสียงออกมาใหม่.

Compression
การสร้างการบันทึกเสียงสามารถนำไปสู่การออกมาเป็นไฟล์ที่มีขนาดใหญ่มากได้, ซึ่งมีข้อจำกัดต่าง ๆ ในการใช้งานจริงของเทคโนโลยีนั้น – เช่น ในเครื่องเล่นเพลงดิจิตอลเครื่องหนึ่งสามารถจัดเก็บเพลงได้มากเท่าใด. ด้วยเหตุนี้ ฟอร์แมทต่างๆ ของไฟล์เสียงส่วนใหญ่จะใช้วิธีการบีบอัดบางรูปแบบ, มีการตัดข้อมูลเสียงบางอย่างออกไปเพื่อลดขนาดของไฟล์ที่จัดเก็บลง.

วิธีการบีบอัดเสียงและการคลายการบีบอัดตอนทำการเล่นกลับจะส่งผลต่อเสียงที่ท่านจะรับฟังได้ในตอนสุดท้าย. ฟอร์แมทของไฟล์ที่มีการสูญเสียข้อมูลจะเรียกว่า lossy. ส่วนฟอร์แมทของไฟล์ที่ยังคงรักษาข้อมูลเสียงไว้ได้หมดหรือสร้างขึ้นมาได้ใหม่ทั้งหมดเมื่อทำการเล่นจะเรียกว่า lossless.

Digital
ต่างจากการบันทึกแบบอนาล็อก, การบันทึกแบบดิจิตอลจะเปลี่ยนเสียงไปเป็นชุดของตัวเลขที่สามารถจัดเก็บในรูปแบบอิเล็กทรอนิกส์ได้ (เช่น ใน CD หรือ ฮาร์ดดิสก์ไดร์ฟ) และจากนั้น ทำการแปลงกลับไปเป็นเสียง เมื่อทำการเล่น .MP3 เป็นฟอร์แมทของไฟล์ดิจิตอลที่ได้รับความนิยมมากอันหนึ่ง.

Dolby Digital
เป็นฟอร์แมทของเสียงมาตรฐานที่มี lossy ใช้กับ DVD และ ฟอร์แมทพื้นฐานของ Blu-ray. แม้ว่า จะเป็นฟอร์แมทที่มีความสูญเสียมากแต่ยังดีพอสำหรับการใช้ในโรงภาพยนตร์. เทียบกับ DTS Digital Surround จะมีคุณภาพเสียงที่ต่ำกว่า, แต่มีอัตราการบีบอัดที่สูงกว่า ซึ่งก็จะได้ไฟล์ออกมามีขนาดเล็กกว่าและด้วยเหตุนี้ Dolby Digital จึงได้รับความนิยมกว้างขวางกว่า.

Dolby True HD
มีฟอร์แมทการบีบอัดเสียงที่มี lossless คล้ายกับ DTS Master Audio. ซึ่งทั้งสองแบบต่างก็เป็นฟอร์แมทเสียงตัวเลือกสำหรับ Blu-ray Disc.

DSD (Direct Stream Digital)
Direct Stream Digital (DSD) เป็นวิธีการบันทึกแบบดิจิตอลที่มีอัตราการเก็บตัวอย่างสูงมาก, สูงกว่าของ Hi-Res Audio และ สูงกว่าของ CD audio 64-128 เท่าตัว. ในทางวิศวกรรมเสียงแล้ว สิ่งนี้จะเป็นไฟล์ดิจิตอลที่มีความใกล้เคียงกับแหล่งกำเนิดเสียงอนาล็อกต้นฉบับมากที่สุด. บางรุ่นของ Sony Hi-Res Audio จะสามารถเล่นเสียงที่เป็นฟอร์แมท DSD ได้ด้วย.

DSEE HX
Digital Sound Enhancement Engine (DSEE) HX เป็นเทคโนโลยี upscaling. เฉพาะของ Sony. เมื่อทำการเล่นไฟล์เพลงดิจิตอลในฟอร์แมทที่มี compressed DSEE HX จะทดแทนความถี่สูงที่สูญเสียไปในเวลานั้นได้เลย, จึงให้เสียงคุณภาพใกล้เคียงกับระดับความละเอียดสูงได้. เสียงทั้งหมดที่เล่นในอุปกรณ์ DSEE HX จะได้การยกระดับขึ้น, ทำให้ท่านรู้สึกได้ถึงความเสมือนได้ไปอยู่ในตำแหน่งที่ห้องสตูดิโอหรือคอนเสิร์ตจริง ๆ.

DTS Digital Surround
เป็นฟอร์แมทของเสียงมาตรฐานที่มี lossy ใช้กับ DVD และเป็นฟอร์แมทพื้นฐานสำหรับ Blu-ray. เมื่อเทียบกับ Dolby Digital DTS Digital Surround จะมีคุณภาพเสียงที่ดีกว่า, แต่มีการใช้งานที่น้อยกว่า เนื่องจาก การมีไฟล์ที่ใหญ่โต.

DTS Master Audio
เป็นฟอร์แมทการบีบอัดเสียงที่มี lossless คล้ายกับ Dolby True HD. ทั้งสองแบบต่างก็มีใช้เป็นฟอร์แมทเสียงตัวเลือกสำหรับ Blu-ray Disc.

DTS:X
เป็นฟอร์แมทของออดิโอแบบเซอร์ราวด์ที่ออกแบบมาเพื่อใช้ในการแข่งขันกับฟอร์แมท Dolby Atmos. ฟอร์แมทนี้เป็นมาตรฐานของออดิโอแบบเป็นเซอร์ราวรอบตัว, สร้างขึ้นมาเพื่อให้ท่านได้สัมผัสอย่างใกล้ชิดกับแอ็คชั่นนั้น ๆ โดยใช้ Height Channels ช่วย, เพื่อสร้างให้มีเอฟเฟคในภาพที่เห็นได้อย่างสมจริงกับเสียงรอบด้าน จึงสร้างบรรยากาศเหมือนกับว่าได้เข้าไปอยู่ในเหตุการณ์นั้นจริง.

Hi-Res Audio
เสียงความละเอียดสูง (High Resolution Audio) อ้างอิงได้กับการบันทึกแบบดิจิตอลที่มี sample rate ที่ 96kHz / 24 bits หรือสูงกว่า. เป็นการให้คุณภาพเสียงที่สูงกว่าการบันทึกของ CD หรือ MP3 มาก – โดยที่ ฟอร์แมท CD audio มาตรฐานจะมีการเก็บตัวอย่างที่ 44.1 kHz / 16 bits.

เมื่อท่านเห็นโลโก้ของ Hi-Res Audio ในเครื่องของ Sony, ท่านจะทราบได้ทันทีว่า เครื่องนั้นได้รับการออกแบบมาให้มีความสามารถทางด้านเสียงสูงที่สุดสำหรับ High Resolution Audio. เริ่มตั้งแต่ เครื่องเล่นเพลงแบบพกพา ไปจนถึงหูฟัง, ลำโพง และระบบโฮมเธียเตอร์เต็มรูปแบบ, ท่านสามารถจะทำการเซ็ตอัพระบบ Sony Hi-Res Audio แบบเต็มรูปแบบได้.

เรียนรู้เพิ่มเติมเกี่ยวกับ Hi-Resolution Audio

LDAC
LDAC เป็นตัว เข้ารหัสเสียง (audio codec) จาก Sony ที่จะยอมให้ท่านได้เพลิดเพลินกับเสียงคุณภาพสูงแบบไร้สายผ่านการเชื่อมต่อแบบ Bluetooth.

เมื่อเสียงมีการส่งผ่าน Bluetooth, เป็นเรื่องปกติที่จะมีการใช้ตัวเข้า/ถอดรหัส Bluetooth SBC codec มาตรฐาน, ที่จะทำให้ได้คุณภาพเสียงที่มีสูญเสียได้. LDAC จะส่งข้อมูลมากถึง 3 เท่าของ SBC codec, ทำให้เสียงยังคงมี คุณภาพสูง ผ่านการส่งทาง Bluetooth และทำให้ท่านพบกับประสบการณ์รับฟังแบบไร้สายที่ปรับปรุงใหม่สำหรับเพลงทั้งหมดของท่านได้.

LFE
แชลแนลสร้างเอฟเฟคความถี่ต่ำ (Low-Frequency Effects (LFE)) เป็นเสียงแทรคที่แยกออกมาสำหรับใช้กับเสียงที่มีระดับเสียงต่ำระหว่าง 3Hz และ 120Hz – เช่น เสียงต่ำ เสียงเอฟเฟคที่กึกก้อง ในซาวด์แทรกของภาพยนตร์. ในระบบเสียง surround แชลแนลนี้ปกติจะส่งไปออกที่ลำโพงsubwoofer.

Lossless
ฟอร์แมทของเสียงที่มีการสูญเสียต่ำของเสียงในรูปแบบที่ยังคงรักษาข้อมูลดิจิตอลต้นฉบับทั้งหมดไว้ หรือยอมให้มีการสร้างขึ้นมาใหม่ในการเล่น. ฟอร์แมทเสียงที่มีการสูญเสียต่ำจะรวมถึง:

  1. DSD (DFF)
  2. DSD (DSF)
  3. WAV
  4. AIFF
  5. FLAC
  6. ALAC

Lossy
ฟอร์แมทเสียงที่มีการสูญเสีย จะลบข้อมูลบางส่วนออกจากการบันทึกดิจิตอลต้นฉบับเพื่อที่จะเป็นการประหยัดพื้นที่, ในขณะที่จะพยายามคงคุณภาพเสียงส่วนใหญ่ไว้ให้มากที่สุดเมื่อทำการเล่นสิ่งที่บันทึกไว้นั้น. แต่ละฟอร์แมทจะใช้วิธี การบีบอัด (compression) ที่แตกต่างกันเพื่อประหยัดพื้นที่และรักษาข้อมูลไว้เพื่อคงคุณภาพเสียงไว้ให้ได้มากที่สุด.

ฟอร์แมทของเสียงที่มีความสูญเสียมาก จะรวมถึง:

LPCM
Linear Pulse Code Modulation (LPCM) เป็นการบันทึกเสียงดิจิตอลแบบพื้นฐาน. สัญญาณ analogue ได้รับการเก็บตัวอย่างในช่วงระยะเวลาที่เท่ากันและค่าที่ได้จะได้รับการบันทึกเป็นจุดหนึ่งของสเกลดิจิตอล. เนื่องจาก ยังไม่มีการจัดการหรือการบีบอัดของข้อมูลนี้, คุณภาพของเสียงจึงอยู่ในระดับที่สูงในระดับห้องบันทึกเสียงสตูดิโอมืออาชีพ – อย่างไรก็ตาม, จะได้ไฟล์ออกมาขนาดใหญ่มากและดังนั้น LPCM จึงไม่เหมาะกับการใช้งานปกติ.

sampling rate เป็นตัวกำหนดความแม่นยำของสตรีมดิจิตอลต้นฉบับ

S-Master HX
เป็นเทคโนโลยีเครื่องขยายเสียงดิจิตอลของ Sony, ที่พัฒนาขึ้นมาเป็นการเฉพาะสำหรับ Hi-Resolution Audio เพื่อลดความผิดเพี้ยนและนอยส์รบกวนลงที่ย่านความถี่ที่กว้างกว่า. เนื่องจาก S-Master จะทำการขยายสัญญาณดิจิตอลโดยตรง – โดยไม่ต้องทำการแปลงไปเป็นสัญญาณอนาล็อกก่อน – จึงสามารถรักษาความบริสุทธิ์ของสัญญาณต้นฉบับสำหรับการสร้างเสียงที่ ตรงกับความเป็นจริงได้มากกว่า.

SA-CD
Super Audio CD เป็นฟอร์แมทการบันทึกที่พัฒนาโดย Sony เพื่อทำการบันทึกเสียงในฟอร์แมท DSD, ที่มีความเหนือกว่า dynamic range ที่ทำได้ใน CD. ในขณะที่ช่วงไดนามิกของ CD audio มาตรฐานจะอยู่ที่ 96db, แต่ของ SA-CD อยู่ที่ 120db.  sampling rate ของ SA-CD อยู่ที่ 2.8MHz, เท่ากับ 64 เท่าของ CD มาตรฐาน.

ไม่เหมือนกับ CD audio โดยทั่วไป, SA-CD จะรองรับเสียงเซอร์ราวด์ 5.1ch ได้เช่นเดียวกับเสียงสเตอริโอ 2-channel. SA-CD audio มีการเข้ารหัสเพื่อจุดประสงค์ป้องกันการคัดลอก, ซึ่งก็หมายความว่าสามารถจะเล่นออกทางสายสัญญาณเอาท์พุทแบบ อนาล็อก , HDMI หรือ i-Link ได้, แต่ไม่มีออกมาทาง สายออฟติคอลหรือโคแอคเชียล.

sampling rate
เมื่อทำการบันทึกดิจิตอลจากแหล่งสัญญาณอนาล็อก, อัตราของการสุ่มตัวอย่างจะเป็นช่วงระยะเวลาระหว่างแต่ละตัวอย่าง, และยิ่งมีค่าสูงขึ้นการสูญเสียก็จะน้อยไปด้วย. เช่น CD audio, จะมีอัตราการเก็บตัวอย่างมาตรฐานอยู่ที่ 44.1kHz, หมายความว่า มีการจัดเก็บตัวอย่าง 44,100 ตัวอย่างในแต่ละวินาที.

โดยทั่วไป อัตราการเก็บตัวอย่างที่สูงกว่าจะหมายถึงการบันทึกที่มีคุณภาพสูงขึ้น. Hi-Res Audio มีอัตราการเก็บตัวอย่างที่ 96kHz หรือสูงกว่าและ bit depth อย่างน้อยที่ 24 bits.

SBC
เป็นตัว Codec เสียงมาตรฐาน สำหรับการส่งสัญญาณเสียงไปทาง Bluetooth. เนื่องจาก SBC ออกแบบมาโดยมีประสิทธิภาพของแบนด์วิดธ์มีความสำคัญเหนือคุณภาพเสียง, จึงเหมาะสำหรับการส่งเสียงคุณภาพสูง. LDAC ของ Sony จะสามารถรับข้อมูลได้มากกว่า SBC ถึงสามเท่าตัว, จึงสามารถส่งเสียงคุณภาพสูงไปทาง Bluetooth ได้.

Subwoofer
ในระบบเสียงเซอร์ราวด์ 5.1ch หรือ 7.1ch ลำโพงซับวูฟเฟอร์จะเป็นลำโพงที่ใช้สร้างแต่เสียงความถี่ต่ำเท่านั้นหรือเป็นแชลแนล สำหรับ LFE. และด้วยการที่เราไม่สามารถจะบอกได้ง่าย ๆ ว่า ความถี่ต่ำ นั้นมาจากทิศทางไหน ดังนั้นลำโพงซับวูฟเฟอร์จึงสามารถจะวางที่ใดในห้องก็ได้.

เนื่องจาก ความถี่ต่ำทั้งหมดจะส่งไปให้กับลำโพงซับวูฟเฟอร์, ลำโพงตัวอื่น ๆ จึงสามารถจะทำเป็นตัวเล็กลงได้– ทำให้ระบบทั้งหมดใช้พื้นที่น้อยลง.

Surround sound
5.1ch และ 7.1ch เป็นระบบสำหรับส่งแชลแนลสัญญาณเสียงแยกจากกันไปให้กับลำโพงที่ติดตั้งอยู่รอบ ๆ ตัวผู้ฟัง, เป็นการสร้างประสบการณ์รับฟังที่เข้มข้น. ตัว .1 หมายถึง การใช้ลำโพง subwoofer 1 ตัว ซึ่งเป็นการเพิ่มเข้าไปของลำโพงความถี่ต่ำ.

Upscaling
เมื่อทำการเล่นเสียงที่มีการบันทึกมาในฟอร์แมทที่มี lossy, บางครั้ง จะสามารถพบว่า มีช่องว่าง (gaps) ในเสียงต้นฉบับโดยการประมาณการทางคณิตศาสตร์จากจุดที่ข้อมูลต้นฉบับเคยอยู่. วิธีการนี้เรียกว่า การอัพสเกล (upscaling), เนื่องจาก จะสามารถยกระดับเสียงที่มีการบันทึกในคุณภาพที่ต่ำกว่า ไปเป็นเสียงคุณภาพสูงโดยประมาณได้.

อัลกอริทึ่ม DSEE HX เฉพาะของ Sony ทำการอัพสเกลแหล่งกำเนิดเสียงที่มีอยู่ให้เข้าใกล้เสียงระดับคุณภาพ Hi-Resolution Audio.