الغرض من هذه الورقة الفنية بدأ بناءً على استبيان حديث لبيانات النقل وزعته الإسكوا على المكاتب الإحصائية الوطنية في الدول العربية. أطلقت الإسكوا مشروعا تجريبيا حول استخدام مصادر البيانات التكميلية عن حوادث السيارات. كانت الفكرة الأولية هي التحقق مما إذا كانت البيانات المقدمة من المكاتب الإحصائية الوطنية يمكن دمجها أو استكمالها بمصادر أخرى للبيانات، بما في ذلك البيانات الضخمة، للتوصل إلى فهم أفضل لأسباب حوادث السيارات وعرض الحلول المتاحة بسهولة على الدول الأعضاء بوسائل ذات تكلفة معقولة لتحسين جمع وتحليل البيانات الخاصة بتلك الدول. تم التحقيق في مصادر البيانات من كل من القطاعين العام والخاص، وتمت مواجهة العديد من التحديات الرئيسية. تشمل هذه التحديات البيانات التي يصعب الوصول لها، والافتقار إلى الأطر التنظيمية لمشاركة البيانات، ونقص الشفافية بين الوكالات الحكومية، والحساسيات العامة تجاه مشاركة البيانات.
ونتيجة لذلك، تم الحصول على بيانات مفتوحة من المملكة المتحدة حول حوادث السيارات، وتمت إضافة بيانات الشارع من OpenStreetMap (OSM) كمصدر بيانات تكميلي لعرض الاحتمالات التي يمكن أن توفرها تحليلات البيانات ومصادر البيانات الجديدة الأخرى. تم إجراء تحليل بالاستعانة بالتعلم الالي، وتم إدخال النتائج في أشجار اتخاذ القرار، والأشجار المعززة بالتدرج والغابات العشوائية للتنبؤ بخطورة إصابة الاصطدام. تظهر النتائج الاولية أنه ثمة علاقة في هذا المجال. وهناك حاجة إلى مزيد من العمل لتحقيق نتائج أكثر موثوقية ولجعل الطبيعة التجريبية للتعلم الآلي أكثر انسجامًا مع الإحصاءات الرسمية، خاصة عندما يصبح الوصول إلى البيانات المطلوبة أكثر سهولة. يسلط التمرين المستخدم في الورقة الضوء على الفوائد المحتملة لاستخدام خوارزميات التعلم الآلي لفهم حوادث السيارات. وتتضمن هذه الفوائد القدرة على رؤية منطق التنبؤ من خلال شجرة القرار ومعرفة الميزات التي تعتبرها النماذج مهمة.