، اللغة الممتدة الرمزية، هي الشكل العالمي للوثائق والبيانات المركبة عبر الويب. ولقد صممت لتحسين وظيفة الويب بتقديم وسيلة تمييز أكثر مرونة ومواءمة. وقد سميت ممتدة "extensible" لأنها ليست شكلا ثابتا مثل HTML (لغة منفردة، سابقة التعريف رمزية). عوضا عن ذلك، فإن XML هي في الواقع 'لغة وصف' - لغة لوصف اللغات الأخرى - حيث تدعك تصمم لغاتك الرمزية الخاصة بك لعدد غير محدود من الأنواع المختلفة للوثائق. وقد جعل مجمل هذه الملامح منها معيارا جاذبا لتبادل البيانات.
إن وثيقة XML عبارة عن مجموعة من البيانات. وهذا يجعل منها في العديد من الحالات، لا تختلف عن الملف. عند إستخدامها "كقاعدة بيانات" فإن XML لها بعض المزايا. فهي على سبيل المثال، ذاتية الوصف (فالرموز تصف البناء وأسماء أنواع البيانات، وليس الألفاظ)، وهي سهلة الحمل (أحادية الترميز)، كما أنها تستطيع وصف البيانات في بنية هرمية أو بيانية.
فيما عدا الكلمات غير الجوهرية، فإن مجمل البيانات في وثيقة أجريس XML هي بيانات PC (بالنسبة للعناصر) أو نص CDATA (بالنسبة للخصائص)، حتى لو كانت تمثل نوع آخر من البيانات، مثل التاريخ أو العدد الصحيح. عموما، فإن برنامج تحويل البيانات سيقوم بتحويل البيانات من نص (في وثيقة XML) إلى أنواع أخرى (في قواعد البيانات) والعكس صحيح.
XML هي لغة وصف رمزية للمحتوى مصممة لتخزين وعرض الوثائق بشبكة الويب العالمية. وعن طريق فصل المحتوى عن الرموز، تتيح لنا XML بناء معلومات يمكن دمجها بسهولة مع مصادر أخرى بالويب.
يتمثل الغرض من DTD، أو معرف نوع الوثيقة، في تعريف البناء القانوني لفقرات وثيقة XML. فهي تقوم بتعريف بناء الوثيقة بقائمة من العناصر القانونية. ومزايا معرف نوع الوثيقة "DTD"عديدة، منها أن كل ملف XML يمكنه حمل وصف خاص به؛ تستطيع مجموعات مستقلة من الأفراد الإتفاق على استخدام تعريف نوعي DTD مشترك لتبادل البيانات؛ يمكن في التطبيق الخاص بك استخدام تعريف نوعي قياسي موحد للتأكد بأن البيانات التي تتلقاها من العالم الخارجي صحيحة؛ كما تستطيع أيضا استخدام التعريف النوعي لتدقيق البيانات الخاصة بك.
إنه من الضروري أن يتطابق بناء مخرجات وثائق XML تماما مع البناء المتوقع للتعريف النوعي للوثيقة "DTD". يعد رسم مخطط قاعدة البيانات المحلية وفقا لمخطط التعريف النوعي حسب XML من أهم التدريبات التي تجرى في هذا السياق.
قام مجتمع W3C XML بتعريف آلية سميت بمسافات أسماء XML "XML namespaces"، حيث يمكن استخدامها كوثيقة XML أُحادية مشتملة على العناصر والخصائص المعرفة والمستخدمة بواسطة مكونات البرامج المركبة. ويعزز هذا الإستخدام بواسطة البرامج المركبة من إعادة الإستخدام كما يمنع من تكرار الإصدار. وتعرف على الوجه التالي:
مسافات أسماء XML "XML namespaces" هي مجموعة من الأسماء، تتحدد بواسطة مرجع URI وتستخدم في وثائق XML كأنواع عناصر وأسماء خصائص. تختلف مسافات أسماء XML عن مسافات الأسماء المألوف استخدامها في إحصاء النظم في أن نسخة XML لها بناء داخلي وليست، مجموعة من الناحية الرياضية.
وفي هذا السياق، فإن مجمل العناصر المعرفة حديثا في مجموعة عناصر بيانات الوصف الزراعية (AgMES)3 تمثل مسافات أسماء. تتولى مجموعة عناصر بيانات الوصف الزراعية3 AgMES تعريف العناصر المطلوبة لتصف بدقة مختلف أنواع مصادر المعلومات في المجال الزراعي. يتم المحافظة على مجموعة العناصر هذه في موقع مستقر ويتم تحديد نقطة مرجعية يجري فيها تعريف العناصر ومن ثم يتم حفظها لكي تستخدم في التطبيقات المختلفة.
في الوقت الحالي يتم تخزين معظم البيانات الببليوجرافية إما في قواعد بيانات علاقية، مثل أوراكل "Oracle" وسكويل خادم 2000 "SQL Server 2000" أو نظم قواعد بيانات أُخرى تدعم XML باستخدام طرق مختلفة. وتتيح هذه المنتجات النشر والمعالجة السهلة، وتقاسم المحتوى على الشبكات المؤسسية وعلى الويب. ومن الخصائص الهامة في هذا الشأن هي أنها ثنائية الإتجاه. بمعنى، أنه يمكن إستخدامها لنفل البيانات من كل من وثائق XML إلى قاعدة البيانات ومن قاعدة البيانات إلى وثائق XML.
في هذه الوثيقة نركز إهتمامنا على قواعد البيانات الموجهة للتحويل إلى XML ، أي على النظم التي تتيح تصدير البيانات إلى XML. ويقدم معظم وكلاء نظم إدارة المعلومات ILMS الحديثة نوعا من الخصائص الوظيفية للتعامل مع XML في منتجاتهم. ولو أنه من المهم الإشارة إلى أن المعالجة الأكثر تعددا للجوانب سوف تسمح باستخلاص، وتحويل واستخراج XML من أي نوع من نظم إدارة قواعد البيانات DBMS، بشرط استخراج شريحة إضافية بعد استخلاص المجموعة الفرعية المستهدفة من التسجيلات.
3 http://www.fao.org/agris/agmes