المطرب الحساوي تحليل ثقافي

هناك بصمة صوتية نجسة و بصمة صوتية طاهرة!!.

 

الثاني و العشرون : البصمة الصوتية
منذ نشأت أي عرق ethnic تكون تلقائياً ثقافة ذلك العرق و أعرافه المتأصلة به , و طبعاً كافة الألحان الخاصة بكل عرق هي وضعية بالعرف المتداول, و على الآلات العرقية الموسيقية المخترعة أو المبتكرة , لأداء العِرق الموسيقي و على طرائق غناء كل عِرق على حدة . ذلك طبيعي جداً و لا يحتاج إلى مفهوم أو شرح مستفيض .
من هذا المنطلق و عليه , كانت تسمى التمتمات العلاجية و تمتمات الاتصال بالأرواح الشريرة , و تمتمات طقوس الديانات الوثنية , كانت تسمى ب ( الحان ) و اللحان طبيعية جداً و المسمى هو لخاصيتها فعلاً , و ما كان السلم الموسيقي ذو السبع نغمات معروف حينها .
و كانت تسمى إنشادات الحروب و أنشاد الأطفال و الأهازيج و الإنشاد الديني الوثني بألحان , لأن لها خاصية الألحان وهي كذلك , كما أنها تلحن و تؤدى بالطريقة العادية للأداء .
و كانت التراتيل و الترانيم تتلى في الطقوس الدينية الوثنية و طقوس عبدة الشيطان , التي اشتدت و تكاملت بعد خروج الديانة النصرانية , و كما هو معروف في عبادة الشيطان , قلب الصليب و شرب دماء الحيوانات في كأس , و تلاوة التراتيل والترانيم الشيطانية , و قصة التعري و المرأة العارية على المذبح , و تبديل - أسم الله تعالى - باسم الشيطان عند أداء التراتيل والترانيم الشيطانية , و كل ما هو معروف عن طقوس عبدة الشيطان , و اللاحان هي الحانهم الكافرة , تؤدى على السلم السباعي الصحيح حالياً, وقبل ذلك كانت تؤدى الحانهم لتراتيلهم و ترانيمهم , على شكل تعويذات شيطانية في العرقية , على الطريقة العرقية الethnic-music .
لو دققنا في هذا الموضوع كثيراً , لوجدنا أن الألحان تلك هي تعاويذ وثنية و شيطانية , و هي تستخدم للترانيم أيضاً , ولكن في تلك الحالتين نستطيع أو نقول أن الألحان عرقية ناقصة , و لا تستحق أن يطلق عليها الحان , إلا بعد اختراع و ابتداع الراهب جيدو أريزو , للسلم الموسيقي السباعي , لأن السلم الموسيقي هو اللحن الموسيقي الوحيد الكامل , الذي لم يتوصل حتى الآن أن يضاف إليه النغمة الثامنة , بل و أن هناك سلالم موسيقية سداسية و خماسية , قد عرفت قبل اكتشاف السلم السباعي , .. أنه و في الأواسط الموسيقية تعرف الألحان كافة بأنها ألحان , و في الأواسط الموسيقية المثقفة فقط تسمى الألحان على السلم الموسيقي السباعي ب ( ألحان ) .
فعلى ذلك نحن نستخدم الطريقة الموسيقية المثقفة لأسماء الألحان الكاملة , وليس الألحان العرقية الناقصة , التي أتنهى مسماها بألحان و ما عاد يصلح لتوسع العلم الموسيقي و الطربي الحالي .
كل ما نود الوصول إليه بعد التحدث بإسهاب ,عن الألحان و أنواعها التعاويذ و الترانيم , هو البصمة الصوتية اللحنية , لكي نثبت بالبصمة الصوتية صحة حديثنا , عن الألحان العرقية الناقصة و الألحان الكاملة السباعية , و المشتقات منها كسلالم كاملة منشقة, و نثبت أن اللحن هو واحد , و لكن يختلف خط سيره و تركيبته اللحنية و تكانيك أداءه , و كثافة بصمة الصوت المؤدي , وكل ذلك يتيبن لنا ويتضح عبر البصمة للحنية المرسومة , صعود و هبوط كمؤثر صعود و هبوط البورصة المالية , بواسطة برامج التنويت للصوت بالكمبيوتر ,
فتوجد لدينا البصمة اللحنية التي تتكرر , في اللحن و تكون واضحة أكثر في الألحان الناقصة , مثل التمتمات و الأهازيج و الإنشادات و التراتيل و الترانيم العرقية , فتكون البصمة الصوتية هي هي و تعاد وتكرر بغير علم في ضمور اللحن الناقص , فهذه بصمات تعاويذ إذا فهم من كلماتها ما يؤدي من كلمات , أما في الألحان الكاملة على السلم السباعي لجيدو أريزو , فأنها تأتي كبصمات تامة غير ناقصة .
فتمتمات تعاويذ الديانات الوثنية يصاغ لها كلمات التعبد الوثني , من تمتمات تقدم على طقوس و تمائم ..إلخ , فأنها تعد الحان ( أي تعاويذ وثنية ) .
و الأهازيج يكثر استخدامها للطقوس الإجتماعية , من أفراح و مناسبات ولادة أو أعياد و خلافهما , وهي الحان ( أهازيج عرقية ) ناقصة ,و قد تستعمل في التعاويذ الديانات الوثنية .
الإنشاد الديني الوثني , هو عبارة عن تعاويذ لحنية للعبادة الوثنية , أما الإنشاد في دور العبادة , فأنه يكون عبارة عن إنشاد أو تراتيل أو ترانيم للديانات , التي تعتبر صلواتهم عبارة عن ابتهالات وأدعية و أذكار ,تردد في العبادة ( وليس لدينا علم كافي في هذا المجال الإنشادي الديني ) .

وإذا قلنا هناك أغنية حب , فأنه لا يوجد تفسير لها إلا كونها تعويذة حب منغمة تقدم لمن يُحَب , ذلك لأن فيها نفس الرجاء و التوسل و الطاعة والولاء , الذي يقدم في التعويذة الوثنية المنغمة للأصنام و الأوثان , و يكمن الاختلاف هنا في الحبيب المناجى بدلا من الصنم أو الوثن .
وأن قلنا أن هناك أغنية جنسية , فهي تعويذه جنسية منغمة يراد من ورائها الوصول إلى ممارسة الجنس , فهي تعويذه جنسية منغمة ,
آخراً .. ان التعاويذ الشيطانية هي لب الموضوع , و أصل الألحان و الغناء فهي أحق و أجدر بالشياطين لأنها عرفت منهم , كما أنه و بواسطة التعاويذ الشيطانية , تتم ترضية الجان بها , لكي يلبون طلبات السحرة العالمين في علوم الشيطنة ,.. وقيسوا على هذا الموضوع الكثير من مفاهيم التعاويذ المنغمة .
أنه بعد اكتشاف جهاز الكمبيوتر , أوجدت برامج لكتابة رسم التموج , و الصعود و الهبوط للصوت , و تعرجاته و دائريته كموجات أو ترددات , والتعرف عليها كرسم لبصمات صوتية مسموعة , لا ترى بالعين المجردة و فبمجرد رؤيتك لرسم البصمة الصوتية , فأنك تستطيع أن ترى و تتعرف على البصمة اللحنية , من شكل الرسم البياني , الذي رسمه برنامج رسم الصوت بالكمبيوتر لك . بل وتستطيع معرفة باقي كل التفاصيل التحليلية الاخرى , لبيانات الصوت من مصطلحات و بيانات , لها مفاهيم خاصة برسم الصوت , وتستطيع أن تعرف البصمة الصوتية العرقية ethnic-music , و البصمة الصوتية كاملة اللحن على السلم الموسيقي السباعي الأصل , و تميز بين السلالم الموسيقية و مؤثر ارتفاعات الحن و انخفاضه .
أنه وقبل خروج برامج التنويت للموسيقى بواسطة الكمبيوتر , كان متدربو الموسيقى الجدد يشككون في المصطلحات الموسيقية , و في أزمانها و كافة بياناتها , و عندما خرجت تلك البرامج أوضحت صحة الرسم , كما هو الصوت الصادر نفسه , وأكدت صحة المقادير الزمنية للنوت الموسيقية , و كافة بياناتها التي كانت من الممكن أن تكذب في السابق أو لا تصدق , أو أنه لم يكون هناك مصحح للبيانات للنوتة الموسيقية , لرسومات للنوت الموسيقية باليد , إلا واقع صحيح ملموس أو مشاهد أو محسوس .

ملاحظة :
أن هذه المعلومات قد يكون من الصعب تفسيرها للقارئ الكريم , لأنها معلومات في هندسة الصوت , و هي مفهومة لدى مهندسي الصوت لأنها معلومات للبصمة الصوتية على ملعب العزف أو مرسم نوت العزف للنغمات , و لقصد الاستشهاد بمعلومات قد توضح قصدنا لتوضيح كيفية عمل البصمة الصوتية رقمياً لنعرف الألحان الناقصة العرقية ال ethnic-music من اللحان الكاملة للسلم الموسيقي ذو السبع نغمات الكامل ,
تعريف ببرنامج رسام البصمات الصوتية بالكمبيوتر و هي برامج التسجيل لهندسة الصوت .
يبين الشكل 1 نظام البصمات الصوتية العام. يتم استخراج ملامح من الصوت ومع هذه الميزات هي التي شيدت كبصمات الأصابع حين يراد منك التبصيم على ورقة مثلاً. أن البصمة الصوتية هي التركيبة الصوتية و تمثل حتمية صغيرة من الصوت و أنها ليست الصوت و لكنها رسم بياني للصوت بواسطة ترانسسترات الصوت التي تحول الموجات الصوتية إلى رسومات و تراكيب مرتفعة و منخفضة على نوعية تكون البصمة الصوتية حين أدائها. في أفضل الأحوال، يكون إدراك الصوت متماثلا يولد بصمات ذات صلة حسب التركيبة الصوتية( و هي البصمة الصوتية ) ، وينبغي لبرنامج رسام الصوت بالكمبيوتر ان يطابق و محاكي و يولد نفس بصمات الصوت و لكن رسماً موجزاً. مع أن بصمة الصوت قد ولدت قائمة مشابهة كبصمات الأصابع لدى الإنسان حين يطلب أن تبصم على ورقة فأن البصمة هي هي لو كررتها عدة مرات للأصبع الواحد.
الشكل 1: A fingerprinter ( بصمة الأصبع ) كالبصمة الصوت العامة.
من الصوت إلى ميزة الاستخراج و من ثم إلى استنتاج الميزات إلى و في كيفية بناء البصمة و من ثم إلى خروج البصمة الصوتية و بعدها استنباط البصمات الأخرى في مرحلة المطابقة للبصمات و من ثم تتم عملية التخريج إلى تحديد نوعية الصوت النهائية.

تتسم بالكفاءة. وتشمل النظم البديلة لتلك التي وصفها Haitsma وKalker (2002)؛ وانغ (2003)؛ Allamanche (2001)، وهناك أيضا مراجعة المادة على البصمات الصوتية التي كتبها و أقرها السيد / كانو وآخرون. (2005). بسير العمل في نظامنا الرقمي ، وهو ما يمكن ملاحظته في الشكل 2، هو بالضبط نفس نظام البصمات الصوتية العام لكنه يظهر التي يتم استخراج الميزات وكيف يتم إنشاء بصمة في نظامنا. الخطوة الأولى هي استخراج ملامح من الصوت، في هذه الحالة استخراج الملعب لمقتطفات نظامية لدرجة النغم من الصوت.

والخطوة التالية هي مماثلة لخلق بصمات الأصابع، وبالتالي فإننا استخدام الرسم البياني الطبقة الملعب للنوت الموسيقية . يحتوي الرسم البياني الطبقة الملعب لكم من عدد المرات التي تم شرحها أي فئة الملعب في قطعة موسيقية أو مقطع موسيقي . يتم تعريف الطبقة للملعب هنا كعدد بين 0 و 1200، لتتوافق مع الارتفاع إلى المائة في عرضه لهيلمهولتز واليس (1912). مثلا: إذا تم الكشف عن قيمة 880Hz، هذا و تردد في هرتز يمكن تحويلها إلى قيمة المائة ج نسبة إلى إشارة التردد ص حساب ج = 1200 × log2 (الاب). مع معيار ص = 8.176Hz1 هذا يجعل عرض المود 8100 1200 = 900 سنت. لهذه المجموعة من الصوت، يتم إضافة قيمة واحدة ل بن يمثلون 900 سنتا في الرسم البياني الطبقة الملعب. إذا كانت كتلة التالي من audio2 يحتوي على سبيل المثال 220Hz، يحدث نفس الشيء بالضبط. يتم ذلك مرارا وتكرارا لكامل القطعة. يرجى ملاحظة أن هذا النهج يتجاهل تماما المعلومات الزمانية، ويوضح المقطع التالي ميزة للقيام بذلك. من الناحية النظرية لا يتم تضمين أيضا معلومات ال timbral في الرسم البياني الطبقة الملعب، في واقع الامر انه لديه نفوذ للتنويت. عندما يتم تنفيذ نفس اللحن المحدد على البيانو مثلاً ، ثم على الناي، وبعد ذلك يتم تحليل كليهما، فإنها تولد مختلفة قليلا رسوم بيانية الدرجة الحوار بعد تعرضه لخصائص الكمال الكشف عن الملعب. مثلا بعض الكشف الملعب قد تخلط بين إيحاءات للترددات الأساسية. فالبيانو الالكتروني يخرج الميدي فايل و الناي كصوت تموج لنه آلة نفخ عرقية لا يعمل بالكهرباء .
والخطوة الثالثة هي لمطابقة البصمات التي شيدت مع قائمة من البصمات المخزنة سابقا. في نظامنا هذا يستلزم حساب تشابه بين المدرج الاحصائي الطبقة الملعب. رسوم بيانية لطبقة الملعب هي أساسا وظائف كثافة الاحتمال، فإنها تصف كيف محتمل هو كتلة من صوت له في الملعب معين
وكخطوة نهائية في هذه العملية، يتم إرجاع القطعة المحددة من الصوت بعد تسجيل بصماتها.

الشكل 2: إن نظام البصمة الصوتية على أساس الخصائص الملعب ورسوم بيانية الطبقة الملعب كما بصمات الأصابع. تتم معالجة البيانات بطريقة متطابقة كما في fingerprinter الصوتية العامة في الشكل 1:

الشكل 3: رسم بياني لطبقة الملعب من أغنية الأفريقية. الرسم البياني للأغنية الأصلية موجودة، جنبا إلى جنب مع الرسم البياني للعكس لها ، وتقديم اقتصاص صاخبة من الأغنية. فإنه يدل على أن رسوم بيانية الطبقة الملعب هي قوية نسبيا ضد التشويه الشديد من الصوت الأساسي.
الشكل 4: رسم بياني الطبقة الملعب من أغنية الأفريقية جنبا إلى جنب مع الرسم البياني لنسخة لعبت 5٪ أسرع والملعب تحول نسخة (دون أن يؤثر ذلك على المدة). فمن الواضح أن ما يقرب من نفس الرسم البياني هو الحالية ثلاث مرات، تحول فقط ما يزيد قليلا عن محور الملعب الأفقي.
ويبين الشكل 4 أيضا لماذا تجاهل المعلومات الزمنية يمكن أن تكون فكرة جيدة. تغيير سرعة تشغيل أغنية - مع ما يقابلها من تحول الملعب - النتائج فقط في التحول الأفقي من الرسم البياني، كما يمكن أن يرى في الرسم التوضيحي. في سياق سائل الإعلام التماثلية هذا يعني أن الشريط المغناطيسي رقمية على سرعة غير صحيحة يمكن أن تكون مطابقة مع نفس المضمون رقمية على السرعة الصحيحة.

ثم يتم استخدام الرسم البياني تداخل أو تقاطع كإجراء المسافة لGedik وبوزكورت (2010) تبين أن هذا الإجراء يعمل بشكل أفضل لفئة ملعب المهام لاسترجاع الرسم البياني. يتم حساب التداخل ج (H1، H2) بين اثنين من رسوم بيانية H1 و H2 مع الطبقات K مع المعادلة 1. لحساب العلاقة مع ن معادلة تحول الملعب 2 يتم استخدامه. للتأكد من أن بن ك يبقى ضمن حدود الرسم البياني يتم حساب K مود العرض. في طلبنا هذا يعني أن يحترم العلاقة اوكتاف، على سبيل المثال مع ن يساوي 50 cent3، وبن في المائة من 1170
3Half نصف نعمة، وينبغي عدم الخلط هنا مع نوعية بصمة مغني الراب الأمريكي.
الجدول 1:

الجدول 1: التشابه بين مختلف رسوم بيانية الطبقة الملعب عدة إصدارات معدلة من أغنية. فإنه يدل على أن الرسم البياني للأغنية مع ضوضاء بيضاء وأضاف يختلف على أكثر من الرسم البياني الأصلي (89٪).
تتم مقارنة H1 مع بن على (1170 + 50) مود العرض 1200 = 20٪ من H2. للعثور على تحول الملعب ن مع أقصى قدر من الارتباط، ويتم تفتيش دقيق ببساطة عن طريق حساب ارتباط لكل تحول محتمل. ومن شأن الممكنة زيادة كبيرة في الأداء يكون للكشف عن القمم في كل الرسم البياني ثم قارن رسوم بيانية فقط على تلك المواقف (التحولات)، وهذا يشبه إلى 'كشف منشط "في Gedik وبوزكورت (2010)
ويبين الجدول 1 الارتباط، على النحو المحدد من قبل المعادلة 2، بين رسوم بيانية مختلفة هو موضح في الشكل 3 و 4، مع الأمثل تحول الملعب ن. فإنه يدل على أن الرسم البياني استنادا إلى إصدار الأصلي، لهذه الأغنية، والكثير جدا الرسم البياني على حد سواء على أساس الصوت عكس (96٪). النسخة مع الضوضاء وأضاف يختلف على أكثر من الأصلي (89٪). الاقتصاص دقيقة واحدة من الأغنية، والذي هو 7 دقائق و 20 ثانية طويلة، ينتج عنه ارتباط من 94٪. التشابه 97٪ بين أسرع 5٪ والملعب تحول نسخة يمكن تفسير حقيقة أن زيادة سرعة 5٪ تترجم إلى تحول الملعب من 84 سنتا وهو ما يقرب من 100 cents4. والفرق الوحيد ثم هو طول الأغنية، أي عدد من العناصر في الرسم البياني، والتي يمكن تطبيع. ويظهر المقطع 3 إذا المشكلة الموضحة هي فريدة من نوعها لهذه الأغنية واحد أم لا.
ويتم تنفيذ هذا النظام في جاوة ويستخدم مقدر الملعب هو موضح في / ماكلويد (2009). لأغراض الاختبار، منصة نسخة مستقلة يمكن تحميلها هناhttp://tarsos.0110.be/tag/FMA2012. هناك يمكنك أن تجد النصوص والبيانات المستخدمة في هذه الورقة
3 النتائج التجريبية
لإظهار أن نظام البصمة على أساس رسوم بيانية الطبقة الملعب ديه Deh المحتملين، وقد تم تجربة على مجموعة بيانات من 10272 الأغاني من وسط أفريقيا (انظر التذييل ألف لمزيد من المعلومات على مجموعة البيانات). شيد التجربة على النحو التالي: من مجموعة البيانات تم نسخها 50 ملفات تم اختيارها عشوائيا. وقد طبقت هذه 50 files5، وتوليد 1350 الأغاني المعدلة - وهناك عدد من التعديلات والآثار - 27 في المجموع. الهدف من التجربة كان يتطابق بشكل صحيح تلك الأغاني 1350 إلى الأصل في مجموعة البيانات. وقد تم الاقتصاص في بداية الملف، كان متوسط طول الملفات المحددة 50 حوالي 4 دقائق، وكان أقصر مدة دقيقة واحدة في الطول.
ويبين الجدول 2 نتائج التجربة. من هذه النتائج يمكن استخلاص بعض الاستنتاجات. 1) منذ استرجاع الأغنية الأصلية تنجح دائما، فإنه من المعقول أن بصمات الأصابع للأغاني هي، على الأقل، فريدة من نوعها ضمن هذه المجموعة البيانات. خاصية هامة لبصمات الأصابع. 2) يتم استرداد الصوت عكس أيضا دائما، مما يدل على ان مقدر الملعب تستخدم يولد تقديرات متطابقة تقريبا على عكس الصوت. هذا هو الاختيار التعقل جيد عند استخدام المقدرات الملعب الارتباط الذاتي القائمة. عند استخدام أجهزة الكشف عن الملعب يعتمد على الأذن نماذج هذا قد يكون أقل هبوط. 3) تحول الملعب يعمل بشكل جيد إلى حد معقول. 4) الأداء عند الخروج من العدد الأول من ثواني يحط بسرعة بين 15 و 20 ثانية. 5) لا يعالج أسلوب الضوضاء البيضاء بشكل جيد. تركت 20٪، 25٪ و 30٪ الإصدارات الضوضاء البيضاء من الجدول منذ لا توجد مباريات. 6) مجموعة البيانات التي تحتوي على أحادي و

4 منذ 2 (84/1200) = 1.05 تحولا من 84 سنتا يترجم إلى تحول في التردد (هرتز) من خمسة في المئة. 5 سوكس - تبادل الصوت، أداة سطر الأوامر، تم استخدامها لتطبيق التأثيرات على الملف الأصلي. واستخدمت اتباع الإرشادات سطر الأوامر: الملعب، والسرعة، عكس، وتقليم، وموالفة whitenoise. لمزيد من المعلومات حول سوكس، والمعنى.

الجدول 2: نتائج مهمة استرجاع على مجموعة بيانات من 10272 ملفات. تم تطبيق 27 تأثيرات على 50 أغنية، وتوليد 1350 نسخ معدلة. وكان الهدف من هذه المهمة إلى العثور على النسخة الأصلية من أغنية. وتشير النسب المئوية وقد تم تحديد الكثير من نسخ معدلة بشكل صحيح في البداية، الأولين، وأول ثلاث ضربات. يتم استرداد النسخة الأصلية والعكس صحيح دائما.
موسيقى الألحان. أظهرت النتائج أن المقدرات في الملعب التي تولدت بمقدار واحد لكل كتلة من الصوت قد يكون كافيا للقيام بهذه المهمة، حتى مع موسيقى الألحان.
4 الخلاصة والعمل المستقبلي
في هذا الموضوع هذه الورقة نهجا جديدا لأخذ البصمات الصوتية، استنادا إلى رسوم بيانية طبقة الملعب، وتم بعد هذه المقدمة، التي رسمت التطبيقات للنظام هذا، وقدمت لكم لمحة عامة عن مبادئ العمل البصمات الصوتية بشكل عام و على وجه الخصوص. وأوضح القسم الثاني أيضا لماذا يمكن استخدامها رسوم بيانية الطبقة الملعب كما هو الاستخدام في عملية التبصيم لبصمات الأصابع. وترد أيضا بعض التفاصيل عن التنفيذ. في القسم وقد تم تقييم الثلاثة خطوات التجريبية.
وقد أظهرت هذه الدراسة أن نظام البصمات الصوتية على أساس رسوم بيانية لطبقة الملعب أنه قوي نوعا ما، ولكن لديه المحتملين الكثير من الأسئلة تبقى مفتوحة. التجربة في هذه الورقة تناقش فقط مهمة استرجاع للأغاني كاملة وبالنسبة لعدد محدود من التأثيرات الصوتية. في بعض الأعمال في المستقبل ما يلي:
1. توسيع مهمة استرجاع لتشمل المزيد من الصوت (الموسيقى الغربية) وتطبيق تأثيرات أكثر الصوت: صدى والتناظرية الرقمية / التناظرية التحويلات الرقمية، وانخفاض معدل الترميز قليلا، تمرير الفرقة الترشيح،. . . اختبار للقوة ضد عدم الاستقرار في الملعب، وكثيرا ما لوحظ في التسجيلات القديمة واختبار مع الضوضاء البيئية واقعية من قاعدة بيانات الضوضاء - على سبيل المثال جمهور صاخبة.
2. وثيقة انخفاض أداء النظام بشكل أفضل باستخدام تدابير استرجاع المعلومات القياسية (الدقة، نذكر، ROC، منحنيات،...). مثلا للقيام تحليل الفشل عند إضافة المزيد والمزيد من الضوضاء.
3. التحقيق في ما يحدث عندما الأغاني الطرقية - وبصماتها - بدون معلومات كثيرة للملعب المستخدم .
4. وبمقارنة هذا النظام مع أنظمة مشابهة على نفس مجموعة البيانات، وذلك باستخدام نفس الإجراءات.
5. معرفة ما إذا كان النظام يمكن تطبيقها لتحديد شظايا صغيرة من الموسيقى بدلا من الأغاني الكاملة. وكيف تكون الألحان الصغيرة بدون الحد الأدنى للجزء؟ هنا تحتاج إلى القيام لرصد البث، و تيارات المعالجة للتكيف؟
6. تجربة مع المقدرات الملعب أو مود العرض تقدير صفاء. إذا تم استبدال مقدر في الملعب، وهناك تأثير كبير على النتائج؟
7. التعامل مع قابلية التوسع والأداء القضايا. يمكن تقليل حجم البصمة، دون فقدان الدقة؟ هل من الممكن لتسريع خطوة مطابقة إلى حد كبير؟
النظام هو موضح هنا يظهر التشابه مع بعض أنظمة كشف الغطاء أغنية، أنها مشابهة جدا لتلك التي كتبها سيرا & G `omez (2008). هذا أمر رائع لأن الهدف من كلا النظامين هو مختلف. هنا نريد التعرف على "نفس الصوت، مع بعض التعديلات، وفي نظام آخر كان الهدف هو تحديد المواد الموسيقية ثابتة (الأغاني الغطاء)، وذلك باستخدام ميزات مشابهة. أوجه التشابه أنظمة منطقية إذا نظرتم الصوت متطابقة، مع بعض التعديلات، باسم "أغنية غطاء الأكثر مماثلة. استخدامها يمكن أن تغطي أنظمة الكشف عن أغنية للتعرف على الصوت متطابقة تقريبا، لأخذ البصمات الصوتية: هذه النتائج بيان في أسئلة جديدة؟ أو معكوس: هل يمكن أن يؤدي نظام البصمة وصفها هنا تؤدي في غطاء الكشف عن الأغنية؟ حاليا، يتم ترك هذه الأسئلة كما عمل في المستقبل. مجموعة البيانات اختبارها في قسم 3 لا تتضمن إصدارات مختلفة - أغطية - من نفس الأغنية. وكملاحظة أخيرة، نود الإشارة إلى أن هذه المادة هي فريدة من نوعها وليس لأنه يقدم خوارزمية قابلة للتطبيق بشكل عام أن يتم اختباره على الموسيقى العرقية أولا. في وقت لاحق فقط سيتم تطبيقه على الموسيقى الغربية. ويرجع ذلك جزئيا إلى حقيقة أن لدينا إمكانية الوصول إلى البيانات الكبيرة مع مجموعة الموسيقى الأفريقية فحسب، بل هو أيضا بيان الفلسفي: بدلا من التقنيات المستخدمة في الموسيقى الغربية للتطبيقات مع الموسيقى العرقي التكيف، لماذا لا، لمرة واحدة، أن تفعل ذلك ل طريقة بديلة؟
المراجع
Allamanche، E. (2001). تحديد القائمة على المحتوى من المواد السمعية باستخدام MPEG-7 وصف مستوى منخفض. في وقائع الندوة الدولية 2ND على استرجاع المعلومات الموسيقية (ISMIR 2001). كانو، P.، باتل، E.، Kalker، T.، وHaitsma، J. (2005). مراجعة البصمات الصوتية. مجلة VLSI معالجة الإشارات، 41، 271-284. تشا، S.-h. (2007). مسح شامل بشأن التدابير بعد / التشابه بين وظائف كثافة الاحتمال. المجلة الدولية للنماذج الرياضية وطرق في العلوم التطبيقية (1)، (4)، 300-307. Gedik، A. C. & بوزكورت، B. (2010). يستند الرسم البياني الملعب التردد الموسيقى استرجاع المعلومات للموسيقى التركية. معالجة الإشارات، 90 (4)، 1049-1063. Haitsma، J. & Kalker، T. (2002). نظام البصمات الصوت القوي للغاية. في وقائع الندوة الدولية 3TH على الموسيقى استرجاع المعلومات (ISMIR 2002). هيلمهولتز، H. فون وايليس، A. J. (1912). على الأحاسيس من لهجة كأساس الفسيولوجية للنظرية الموسيقى (ترجمتها وتوسعت بنسبة الكسندر J. إليس، الدكتور الإنجليزية 2ND.) [كتاب]. ونغمانس، أخضر، لندن. ماكلويد، P. (2009). سريعة ودقيقة أدوات الكشف الملعب لتحليل الموسيقى. ACADEMISCH proefschrift، جامعة أوتاجو. قسم علوم الحاسب الآلي. Moelants، D.، كورنيليس، O.، ويمان، M. (2009). استكشاف جداول نغمة الأفريقية. في وقائع الندوة الدولية 10TH على الموسيقى استرجاع المعلومات (ISMIR 2009). سيرا، J. & G `omez، E. (2008، 31/03/2008). تحديد أغنية غطاء الصوت بناء على محاذاة تسلسل نغمي. في "المؤتمر الدولي IEEE على الصوتيات والكلام ومعالجة الإشارات (icassp) (ص 61-64). لاس فيغاس، الولايات المتحدة الأمريكية. المتاحة من الملفات / المطبوعات / jserra ICASSP08.pdf ستة، J. & كورنيليس، O. (2011). Tarsos - منصة لاستكشاف الملعب الميزان في الموسيقى الغربية غير الغربية و. في وقائع الندوة الدولية ال12 في الموسيقى استرجاع المعلومات (ISMIR 2011). ساندبرغ، J. & TJERNLUND، P. (1969). قياسات الكمبيوتر مقياس لهجة في الموسيقى التي تؤدى رسوم بيانية تردد. STL-QPS، 10 (2-3)، 33-35. Tzanetakis، G.، Ermolinskyi، A.، وكوك، P. (2002). رسوم بيانية الملعب في استرجاع المعلومات صوت الموسيقى والرمزي. في وقائع الندوة 3TH الدولي للموسيقى استرجاع المعلومات (ISMIR 2002) (ص 31-38). وانغ، A. L. (2003). و-القوة الصناعية الصوت خوارزمية البحث. في وقائع الندوة 4TH الدولي للموسيقى استرجاع المعلومات (ISMIR 2003) (ص 7-13).

البحث
إعلان
التقويم
« أكتوبر 2018 »
أح إث ث أر خ ج س
  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31      
التغذية الإخبارية