[التكنولوجيا والمستقبل] نظام الصوت للهواتف الذكية لدينا

زياومي المكبس شنومكس
ECOVACS

قررنا هذا الأسبوع عدم احترام العادات القديمة ، والتي نرغب في وجود مقالتين في هذا العمود مخصصين على التوالي للجوانب الحالية والآفاق المستقبلية لنفس المكون ، وقمنا بتقسيم المساحة الموجودة تحت تصرفنا بين تقنيتان مختلفتان تمامًا.

إذا كنا قد غضنا يوم الأحد عن قلب هواتفنا الذكية لوصف الأبراج GPS و GLONASS التي تجعل المواقع الفضائيةلذلك ، سنبقى اليوم على سطح الكوكب لتحليل النظام الذي سيكون جيدًا على تلك المسافة من غلافنا الجوي poco المعنى: ال قطاع الصوت من الهواتف الذكية لدينا.

سماعات meizu EP80

في هذه المقالة ، على وجه الخصوص ، سوف نتبع رحلة أ إشارة صوتية من خلال ميكروفون من أجهزتنا تصل إلى ملكهم ذاكرة، ثم تتبع المسار العكسي حتى آذاننا. ستكون رحلة طويلة ولكنها رائعة ، إذا اتبعت بالكامل ، ستوضح العديد من التفاصيل لتكنولوجيا ناضجة بالفعل ولكنها لا تزال أساسية.

الطريق إلى الرقمية

الصوت ، سواء كان ناتجًا عن مهارة موسيقي ماهر أو من خلال النشاط المخيف لطبيب الأسنان ، ليس أكثر من مجرد مجموعة من موجات الاهتزاز أن ينتشرون في الاتجاه الذي تأتي فيه السيارة (نحن مهتمون بالهواء ، ولكن يمكن أن تكون أيضًا صلبة أو سائلة) مضغوط. ويقال إن موجات من هذا النوع ، على وجه الخصوص طولي.

بغض النظر عن أصل الاهتزازات ، وبالتالي ، فإن الميكروفون من أجهزتنا (التي وصفناها بالفعل في أ المادة السابقة) سوف ينظر واحد اختلاف الضغط على طول اتجاه انتشار الموجة ، والتي سيتم تحويلها إلى إشارة كهربائية. ومع ذلك ، فإن المعلومات التي يتم جمعها بهذه الطريقة من الميكروفون التناظرية وبالتالي ، غير مفهومة من قبل SoCs للهواتف الذكية لدينا هذا السبب بطريقة رقمية.

صوت
http://www.ultrasuoni.it/img/foto/onde.jpg

بحيث يمكن استخدام الإشارة ، لذلك ، يجب معالجتها بواسطة ADC (محول تناظري إلى رقمي) والذي يترجمه إلى سلاسل رمز ثنائي. قبل وصف المبادئ الكامنة وراء هذا المكون ، من الضروري تقديم اثنين من المفاهيم النظرية التي هي في أساس تشغيل النظام بأكمله.

يجب أن نذكر ، على سبيل المثال ، نظرية فورييه التي تؤكد لنا أنه من الممكن كسر أي واحد وظيفة دورية، ومع ذلك معقدة ، في واحد مجموع (ربما لانهائي) من الأمواج جيبية. هذا يعني عمليًا أنه بدلاً من التفكير في صوت عام (والذي يمكن أن يكون أحلى موسيقى وأكثر ضوضاء مزعجة ، بغض النظر عن الجرس) يمكننا أن نقتصر ، من أجل الخطية ، على الحالة الجيبية البسيطة. دون أن يفقد الخطاب عموميته.

فورييه
http://3.bp.blogspot.com/-S0GX8S4w1TE/TyrK8-tnGpI/AAAAAAAAKFY/kOM6ADRkOeI/s1600/sFFT4.png

لموجة من هذا النوع ، على وجه الخصوص ، مفاهيم تردد (عدد المرات التي تتكرر فيها الموجة في ثانية ، تقاس ب قلب) وبناءا على السعة، أي الإزاحة القصوى لجزيئات الهواء من موضع التوازن (أو الجهد من قمة إلى أخرى للموجة في حالة الإشارة الكهربائية). من المثير للاهتمام أيضًا ملاحظة أن الأذن البشرية في حالة جيدة تكون حساسة فقط لموجات التردد بين 20 Hz و 20000 Hz، وبالتالي فإن كل الموجات خارج هذا النطاق يمكن أن تكون الإهمال دون خسارة كبيرة في الجودة.

هذه الميزة من آذاننا أمر أساسي لرقمنة الصوت لأنها تسمح بتدخل نظرية أخذ العينات نيكويست شانون. في الواقع ، هذه النتيجة النظرية الهامة تضمن أنه من الممكن اختبار إشارة تناظرية عرض النطاق الترددي المحدود دون فقدان المعلومات ما دام تردد أخذ العينات أكبر من Nyquist (يساوي ضعف الحد الأقصى لتردد الإشارة).

أخذ العينات
http://www.tnt-audio.com/gif/convertus21.gif

وقال بكلمات أبسط هذه النظرية يؤكد لنا أنه من خلال اتخاذ أكثر من واحد 40000 "صورة" من الإشارة ، فمن الممكن إعادة بناء بالضبط في نطاق التردد الذي تكون فيه الأذن البشرية حساسة. الخطوة الأولى التي يجب على ADC اتخاذها هي إزالة مكونات الموجة الصوتية (التي أصبحت إشارة كهربائية بفضل الميكروفون) ذات تردد عالٍ للغاية ، والتي ، على الرغم من عدم إدراكها للإنسان ، من شأنها أن تخلق أخطاء إذا تم أخذ عينات منها.

إذا كانوا موجودين أيضًا في الإشارة ترددات أكبر من نصف من أخذ العيناتفي الواقع ، يمكن للمرء أن يكون مظهر التعرج: خلال مرحلة إعادة الإعمار في DAC لا يستطيع التمييز البيانات الناتجة عن أخذ عينات هذه الموجات مع تلك الناتجة عن الترددات المنخفضة ، وبالتالي ، سوف تتكاثر صوت مختلف جدا عن الصوت الأصلي. وبالتالي ، فإن التردد العالي لأخذ العينات أقل حساسية لنوعية مرشحات الإدخال ويسمح نظريًا بتسجيل الأصوات خارج النطاق المسموع.

التعرج
http://www.tnt-audio.com/gif/convertus20.gif

في اتجاه التيار لمرشحات التمرير المنخفض القوية التي تحد من نطاق الإشارة ، لذلك يجب أخذ عينات من الأخيرة ، أي "تصويرها" عن طريق عينة وعقد (والذي يتكون في أبسط نسخة من مكثف ومفتاح وترانزستور) الذي يمنعه للوقت اللازم ثبت قيمة. تتكون عملية التكمية في مقارنة عينة الإشارة مع سلم (مرقمة في ثنائي) من المستويات ، وكإجابة تقوم بإرجاع رقم الخطوة التي أفضل نهج الإشارة.

ADC
http://image.slidesharecdn.com/adcmcu-150115041854-conversion-gate02/95/analog-to-digital-converter-3-638.jpg?cb=1421295547

بهذه الطريقة ، يتم تشفير الموجة الصوتية في PCM (تعديل رمز النبض ، في الواقع هو فقط واحد من التعديلات الممكنة) ، أن يكون رقمي، هو في النهاية مفهومة تماما عن بقية الدوائر SoC.

أخيرًا ، نلاحظ أن تردد أخذ العينات الأكثر استخدامًا اليوم لا يزال يمثل a 44.1 كيلو هرتزالتي تم تأسيسها بعد نشر الأقراص المضغوطة ، ويتم قياس عدد مستويات المقياس (الذي ليس بالضرورة خطيًا) بالبتات. نظام مع ن بت، على وجه الخصوص ، سوف يكون 2 ^ n levelsثم ADC a 24 بت ستتاح خطوات 16777216 المتوفرة مع خطأ التكمية خفضت إلى فقط أجزاء 0.06 لكل مليون يساوي نطاق ديناميكي من 144 ديسيبل .

ضغط: ضياع و ضياع

في هذه المرحلة ، يمكننا الخوض في عالم ADCs بدقة أكبر ، وربما توضيح أحد أكثر النماذج استخدامًا في مجال الصوت (مثل النموذج الذي يحتوي على تقديرات تقريبية متتالية). ومع ذلك ، فإن تحليلًا من هذا النوع سيعطي مساحة كبيرة ، وربما لن يكون مثيراً للاهتمام للعديد من القراء. لذلك قررنا الاستفادة بشكل أفضل من هذه المقالة من خلال تخصيص بعض المساحة لها عملية ضغط وهو ، في كثير من الأحيان ، سبب النتائج السيئة أو لا يتماشى مع التوقعات.

من ناحية أخرى ، فإن فكرة تخزين الصوت مباشرة بتنسيق PCM ليست الأفضل من وجهة نظر استهلاك الذاكرة. إذا كان مسار الاستريو الكلاسيكي للقرص المضغوط يستغرق تقريبًا 10 ميغابايت لكل دقيقةفي الواقع ، هناك ضغطات دون فقدان المعلومات (باللغة الإنجليزية ضياع) هذا تقليل الحاجة إلى ذاكرة تصل إلى 60٪.

فلك
https://upload.wikimedia.org/wikipedia/commons/thumb/e/e0/Flac_logo_vector.svg/2000px-Flac_logo_vector.svg.png

هذه الأنظمة غير إدراكية وتعتمد على استخدام الخوارزميات لإزالة تكرار البيانات، وهذا يعني إزالة التكرارات غير الضرورية للمعلومات. يمكننا أن نفترض ، على سبيل المثال ، أنه يوجد في ملفنا الصوتي صوت يتكرر دوريًا دائمًا كما هو: بدلاً من إعادة كتابته في كل مرة ، سيكتبه برنامج الترميز مرة واحدة فقط ويشير إلى كيفية تكراره.

في الواقع ، تتم إزالة الزيادات عن الحاجة بطريقة أكثر تعقيدًا إلى حد ما ، والتي تستند إلى استخدام التنبؤات الخطية e بقايا. في الواقع ، يقوم برنامج الترميز بتحليل كتلة المرة الأولى ، ومن خلال تطبيق خوارزمية ، يحصل على المعلمات تسمح بتقريب الفاصل الزمني التالي بدءًا من الأول. الفرق بين التنبؤ بالبرمجيات والإشارة الحقيقية ، ثم ، يتم ترميزها بشكل منفصل ، بحيث يكون فك ممكن يمكن إعادة تكوين الكتلة الثانية دون فقدان المعلومات. تكرار العملية عدة مرات ، وأخيرا ، سوف ترميز الملف الصوتي بأكمله.

التنبؤ الخطي
https://www.ntt-review.jp/archive_html/200712/images/sp2-Fig-5.gif

ومع ذلك ، فإن عالم الأنظمة غير الحسية يتضمن أيضًا خوارزميات النوع الضياعأي ضغط المعلومات خسارة جزء. يمكن تحقيق ذلك ، على سبيل المثال ، باستخدام واحد مقياس التكمية غير الخطية الأكثر حساسية للأصوات poco أكثر شدة من تلك الأكثر شدة. بهذه الطريقة يكون من الممكن تقليل الرقم من الخطوات ، وهذا هو ، عدد بت المستخدمة لكل عينة، دون خسائر مفرطة في جودة الإشارة (يستخدم هذا النظام على نطاق واسع للاتصالات السلكية واللاسلكية ، التي تستخدم مقياس لوغاريتمي).

تقنية أخرى مستعملة للغاية ، إذن ، هي التفاضلية PCM التكيفية, والذي يتكون من ترميز الفرق في السعة بين عينة وأخرى. في الواقع ، تظل هذه الكمية صغيرة جدًا في معظم الحالات وبالتالي تتطلب a عدد أقل من بت. في حال وجودها تغييرات مفاجئة في الصوت ، بدلا من ذلك ، يقوم برنامج الترميز بتكييف خطوة التكمية لتجنب الخسائر الكبيرة في الجودة.

ADPCM
https://ackspace.nl/w/images/c/cb/ADPCM.GIF

نظرًا لأن الضغط أو الجودة التي يتم الحصول عليها بهذه الأساليب غالبًا ما تكون غير كافية ، فقد حان الوقت أخيرًا للغوص في بحر كبير من أنظمة إدراكية. هذه التقنيات ، كما يوحي الاسم ، تقوم على حقيقة أن آذاننا، في شروط معينة، يبدو أنها ليست حساسة لبعض مكونات الصوت وبالتالي يمكن القضاء عليها.

العلم الذي يدرس هذه الظاهرة هو على وجه الخصوص علم النفس المسموعي الذي يخبرنا ، تبسيطًا كثيرًا ، أن مساهمة مكون الصوت تعتمد على مساهمته عمق، دالا سوا تردد وبوجود المكونات المجاورة قادرة على قناع ذلك.

الضياع
http://www.oocities.org/tuttowindows98/img/perceptive.gif

لذلك ، يجب أن يكون هناك برنامج ترميز ضار للنمط الإدراكي تحليل في التردد إشارة البدء ، أي ، يجب أن تحولها إلى مجموع الجيوب الأنفية التي ذكرناها عند الحديث عن نظرية فورييه. في هذه المرحلة الخوارزمية سوف تقدير أهمية من المكونات الفردية ، وبناءً على النتائج ، القضاء هم أقل أهمية. وأخيرًا ، سيتم ضغط الترددات المتبقية ، وسيتعين إعادة استخدامها ، باستخدام التحويل العكسي.

في هذه المرحلة ، ستدرك أنه ليس فقط الصوت النهائي سيكون مختلفًا تمامًا عن الصوت الأصلي ، ولكن قبل كل شيء سيعتمد على برنامج الترميز المستخدم. بغض النظر عن معدل البت ، على وجه الخصوص ، فإن الخوارزمية ذات الجودة الرديئة ستعطي نتائج سيئة ، في حين أن الجودة العالية ستكون قادرة على الحصول عليها ضغطات ممتازة بدون (أو تقريبًا) أن آذاننا يمكنها إدراك الفرق فيما يتعلق بالأصل.

الطريق الى الوراء

الآن بعد أن رأينا كيف يمكنك تسجيل ساعات من الصوت في مساحة صغيرة جدًا ، يمكننا أن نرى في النهاية ما يحدث عندما نضغط على زر التشغيل لتطبيق الموسيقى المفضل لدينا. سنترك العملية بالطبع إزالة الضغط، أين خوارزميات نتتبع الطريق التي الترميز لإعادة إنتاج الصوت الذي هو فية لالأصلي (وإن كانت مختلفة في كثير من الأحيان)، وستركز على DAC (رقمي لتحويل Ananlog) وعلى "الحيل" المستخدمة من قبل هذا لتحسين التكاثر.

قبل المضي قدما ، ومع ذلك ، فمن الصحيح لتوضيح أن عمليات ضغط وانزعاج انهم غالبا ما تجري داخل DSP (معالج الإشارة الرقمية) متكاملة في شركة نفط الجنوب. علاوة على ذلك ، غالباً ما يتعامل هذا المكون مع التطبيق مرشحات البرمجيات خاص يجب ، في نية الباني ، تحسين متعة الصوت (على سبيل المثال زيادة الجهير أو إنشاء تأثيرات 3D).

مركز الصوت

ومع ذلك ، فإن الجزء السفلي من هذا المكون هو DAC لدينا المسؤول عن إعادة إنشاء ذلك إشارة تناظرية هذا من خلال واحد المتحدث، يصبح الصوت. في كثير من الأحيان لدينا الهواتف الذكية شريحة واحدة الذي يدمج DAC و ADC (حتى إذا كان هذا المكون الأخير موجودًا بشكل متزايد بالفعل في الميكروفون) ، وعادة ما يكون لهذه "محاور الصوت" أيضًا متحكم دقيق يستخدم في المؤثرات الصوتية من مختلف الأنواع.

ومع ذلك ، يجب على DAC حل بعض المشاكل الموروثة من النظام المستخدم من قبل ADC لتسجيل الإشارة. التعرج، على سبيل المثال ، ستظهر أيضًا في ملف تحويل إلى التماثلية وفي وجود تكرار لأخذ العينات poco أعلى من Nyquist ، سيكون من الصعب التخلص منها ما لم تستخدم مرشحات تمرير منخفضة قوية (ومكلفة). منذ التعرج سيكون دائما تقريبالذلك ، نظام ال الإفراط لمنع انعكاس آثاره في الإشارة النهائية.

الإفراط
http://www.tnt-audio.com/gif/convertus27.gif

يتكون أخذ العينات منزيادة مصطنع تردد أخذ العينات عن طريق إدخال ط عينات فارغة، والتي سيتم إزالتها بعد ذلك من DAC. وبهذه الطريقة ، دائمًا ما يكون الاسم المستعار موجودًا ، ولكن si الانتقال إلى ترددات أعلى التي يتم التخلص منها بسهولة بواسطة المرشحات poco باهظة الثمن ، وعلى أي حال ، فهي غير مسموعة للأذن البشرية ويتم استنساخها بشدة بواسطة المتحدثين العاديين.

لتجنب المشاكل بسبب تكميم إشارة (والتي تصبح مهمة للغاية في وجود الموجات poco كبير) عندئذٍ ستكون هناك حاجة لعملية ثبات الألوان. على سبيل المثال ، تخيل موجة جيبية من عرض صغير التي يتم تسجيلها فقط من قبل الأكثر حساسية.

التردد
http://www.tnt-audio.com/gif/convertus23.gif

في هذه الحالة ، ستكون الموجة الأصلية في أعين لجنة المساعدة الإنمائية "موجة مربعة دورية ، والتي إذا تم إنتاجها ، ستشعر بها الأذن البشرية كواحد تحريف. إذا قمت بتقديم ضجيج خلفية عالية التردد ارتجف، ومع ذلك يمكن قناع وجود هذه الموجة poco ارضاء آذاننا. ال التردد، لذلك، "التجارة" تشويه مع الضوضاء.

ومع ذلك ، فإن DAC مسؤول عن إعادة إنشاء الشكل الموجي الأصلي باستخدام العكس المقياس المستخدم من قبل ADC. بمجرد استلام رقم الخطوة (يتلقى أكثر من 40000 في الثانية) ، لذلك ، هذه الدائرة ينبعث عند المستوى المقابل. وبالتالي ، ستكون الإشارة الأخيرة مساو (ضمن أخطاء التكمية وأخذ العينات) إلى الخطأ الأولي ويمكن توجيهها إلى a مكبر الصوت.

altpoparlante
http://www.dizionariovideogiochi.it/lib/exe/fetch.php?media=gennaio08:altoparlante.gif

أسفل المصباح ، الذي يتعامل مع زيادة سعة الإشارة (كسب) وله ربما، هناك أخيرا ذلك المتحدث الذي بفضل له لفائف المحمول، يحول الإشارة الكهربائية إلى واحد اهتزاز ينتشر في الهواء ويصل في نهاية المطاف إلى آذاننا.

نأمل أن تكون قد استمتعت بهذه الرحلة الصغيرة في عالم الصوت وأنه حتى لو لم نتطرق إلى العديد من الموضوعات العزيزة على جمهور عشاق الصوتيات ، فلديك فكرة عن كيفية عمل قطاع الصوت في هواتفنا الذكية. أخيرًا ، نود أن نعلمك أنه في المرة القادمة في عمود "التكنولوجيا والمستقبل" سنتحدث عنه أنظمة الاتصالات السلكية واللاسلكية التي هي أساس الجزء "الهاتف" (وليس فقط) من أجهزتنا!