يعطي معرف نوع وثيقة أجريس AGRIS DTD مجموعة من العناصر، والمحددات والنظم لوصف وتدعيم البنية التي تجعل من XML تسجيلة ببليوجرافية. من الضروري عند إنشاء أو تصدير وثائق أجريس في شكل XML، أن يتم إلحاق الرأس المبين أدناه.
<?xml version="1.0" encoding="UTF-8"?> |
يجب أن تعلن كافة وثائق XML عن أنها وثائق XML بكتابة الإعلان التالي:
<?xml version="1.0" encoding="UTF-8"?> |
هذا السطر يخطر البرنامج الذي يتلقى ملف بيانات XML بأنك تكتب بلغة XML وبأنه يجب أن يجعل الملف متوافقا مع مواصفات XML طبعة منقحة 1. وسوف نتناول موضوع التشفير بهذه الوثيقة فيما بعد. ونظرا لأن حقل XML هذا لا يحمل بيانات فعلا، فإنه لا يحتاج إلى علامة إغلاق ويجب أن يكون موجودا في بداية الوثيقة.
عند ترميز الوثائق باستخدام معرف نوع الوثيقة "DTD"، فإنه من العمليات القياسية تضمين إعلان نوع الوثيقة "DOCTYPE" حتى يمكن لأداة المعالجة "know" التي تقوم بتعريف نوع الوثيقة DTD قيد المعالجة التيقن من توافقها. وعند تدقيق وثيقة XML مقابل المعرف DTD عن طريق برنامج قواعد XML، سيتم مراجعة وثيقة XML للتأكد من وجود كافة العناصر المطلوبة وبأنه لم يتم إضافة أية عناصر غير معلنة. ويجب المحافظة على البنية الهرمية للعناصر المعرفة في تعريف نوع الوثيقة "DTD". وسيتم مراجعة قيم كافة الخصائص للتأكد من أنها تتفق مع الدليل المحدد. باختصار، سيتم تعريف وتدقيق كل تفصيلة في وثيقة XML من القمة إلى القاع بواسطة معرف نوع الوثيقة "DTD". ويسهل ذلك من عملية تأكيد الإتساق بين مجموعات وثائق XML، مثل تلك الموردة إلى مستودع أجريس من مختلف أنحاء العالم.
<!DOCTYPE ags:resources SYSTEM "http://purl.org/agmes/agrisap/dtd/"> |
الإعلان المبين أعلاه عن نوع الوثيقة من أجريس، والذي تم ترميزه باستخدام معرف نوع الوثيقة الخاص بأجريس، يشير إلى أن نوع الوثيقة هو ags:resources وإلى أنها تتفق مع معرف نوع الوثيقة "DTD". ويتطلب الأمر أن يتم تدقيق وثيقة XML بواسطة معرف نوع الوثيقة للتأكد من سلامة بنية البيانات. ويمكن لوثائق XML أن تدقق قبل تحميلها.
وتشير هذه الإعلانات إلى PURL (الموقع الدائم للمصدر القياسي)، التي تيسر عملية التدقيق، إذا كان الحاسب متصل بشبكة الإنترنت. وإذا لم يكن الأمر كذلك، فإنه يلزم استخدام معرف نوع الوثيقة "DTD" المتضمن بالملحق.
يجب أن يأتي إعلانن مسافات الأسماء في السطر التالي بعد إشارة معرف نوع وثيقة XML. ونظرا لأنه يمكن أن تحتوي الوثائق على مسافات أسماء متعددة، ونظرا لأمكانية وجود تضارب بين إشارات التحديد "prefixes"، فإن مسافات الأسماء تسمح لمطوري البرامج بتصميم إشارات تحديد "prefixes" لأكواد المصادر القياسية "URIs" للعناصر ومكوناتها، وليس على مستوى الوثيقة فحسب.
<ags:resources |
xmlns:ags="http://purl.org/agmes/1.1/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:agls="http://www.naa.gov.au/recordkeeping/gov_online/agls/1.2"> |
في المثال الموضح بعاليه، ثمة أربعة إعلانات لمسافات الأسماء: "ags, dc, dcterms, agls"، وعموما، فإن مسافة الإسم تحدد بتكويد مجموعة من الأسماء أو الحقول حتى لا يكون هناك لبس عندما تختلط معا حقول لها أصول مختلفة ولكن ينفس الأسماء. حيث يختلف مثلا dcterms:citation عن ags:citation.
إن الأنساق المستخدمة في وصف فئة وثائق “AGRIS” هي نص فقط أيText Only (dc:type, dc:source, إلخ...), عنصر فقط أيElement only (dc:citation, agls:availability, etc.) ومحتوى خليط أي Mixed content (dc:title أو dc:relation). وتعتبر كافة الخصائص سلاسل محارف بيانات (CDATA) باستثناءags:ARN, وهو معرف متفرد للعنصر الجذريags:resource (ID) والخاصية الإحتياطية xml:lang التي يجب عند استخدامها أن تقتصر على كود من ثلاثة حروف للغة حسب المواصفة ISO639-212.
وفقا لمعرف نوع الوثيقة DTD، فإنه يتم الإشارة إلى تواجد العناصر بواسطة المؤشرات التالية:.
(بدون مؤشر) |
إلزامي |
عنصر واحد فقط |
+ |
إلزامي، متكرر |
عنصر واحد أو أكثر |
? |
إختياري |
بدون أو عنصر واحد |
* |
إختياري، متكرر |
بدون، أو عنصر واحد أو أكثر |
سيتم في هذا الفصل شرح كيفية تكويد كل عنصر، ومصفاة ونظام لإستخراج عناصر XML جيدة التكوين. كل جدول يصف نموذج محتوى العنصر، وقالب يشرح كيف يتم تعليم المحتوى، والخصائص وعما إذا كانت إلزامية.
تحل هذه الخاصية محل حقل أجريس السابق رقم التسجيلة المؤقت (TRN). ولهذه الخاصية قصور في تحقيق صحة الهوية التي تعطي التفرد لمصدر أجريس. ولذلك فإنه من الضروري أن يتم استخدام نظام ترقيم متفرد للتمييز بين تسجيلتين. وخاصية ARN إلزامية لكل التسجيلات المسلمة لأجريس. وتتكون بنية هذه الخاصية الإلزامية من 12 حرف، مقسمين إلى ثلاثة مجموعات. ويحتوي ARN النموذجي على ما يلي:
أ- كود الدولة ثنائي الحروف حسب مواصفة ISO للدولة التي يقع بها مقر مركز أجريس أو كود المؤسسة متعددة الجنسيات أو الدولية التي تورد مدخلات. ويمكن إيجاد هذه القائمة في ISO3166-1 للأكواد الجغرافية. وتتوفر أكواد أجريس التي يتم حاليا استخدامها بالمراكز في ملحق C بدليل مستخدم سمات تطبيق أجريس أو في موقع أجريس بالويب.
ب- السنة التي يتم فيها إنشاء التسجيلة. ويجب أن تتكون من أربعة أرقام وهي ليست سنة نشر المصدر.
ج- كود المركز الفرعي المحدد بواسطة مركز مصادر أجريس، يتكون من حرف واحد فقط، يستخدم بالدول التي لها أكثر من مركز للمصادر، ويمكن أن تكون حرف هجائي أو رقم. وفي الدول التي بها أكثر من تسعة مراكز فرعية يمكن أن يكون كود المركز الفرعي حرف هجائي. وللدول التي بها مركز مصادر واحد فإنه يجب إدخال صفر (0) في هذا الحقل.
د- عدد مكون من خمسة أرقام. ويمكن تخصيصه بصفة سنوية كما يمكن أن يكون مجرد رقم تصنيف محلي، مثل رقم مكتبة داخلية. مثال:
ذلك هو العنصر الجذري ويحوي كافة العناصر والمُعرفات الجوهرية الأخرى. وتعتبر خمسة من العناصر الجوهرية إلزامية، هي العنوان، التاريخ، الموضوع، اللغة ومعلومات الإتاحة. وهي أكثر العناصر أهمية، حيث أنها تضم باقي الوثيقة وتعتبر مترادفة مع نوع الوثيقة "document type".
XML content model |
(dc:title+, dc:creator*, dc:publisher*, dc:date+, dc:subject+, dc:description*, dc:identifier*, dc:type*, dc:format*, dc:language+, dc:relation*, agls:availability+, dc:source?, dc:coverage*, dc:rights*, ags:citation*) | |
XML tag |
<ags:resource ags:ARN="XF2004000244"> </ags:resource> | |
XML attributes/schemes |
ags:ARN (See 4.3.1). |
مطلوب |
يتم تدوين عنوان الوثيقة في هذا العنصر، ويتم أيضا تدوين، العنوان المترجم للمصدر إذا كان متاحا (dcterms:alternative).
XML content model |
( * #PCDATA | dcterms:alternative ) | |
XML tag |
<dc:title xml:lang="eng">title of resource | |
XML attributes/schemes |
xml:lang |
required |
يتم في هذا العنصر وصف كافة الكيانات (الوكلاء) التي تتعامل مع المصدر، من حيث التأليف أو المشاركة. ويمكن أن تضم شخصا (ags:creatorPersonal)؛ مؤسسة، خدمة أو وكالة (ags:creatorCorporate)؛ أو مؤتمر (ags:creatorConference).
XML content model |
(ags:creatorPersonal | ags:creatorCorporate | ags:creatorConference)* | |
XML tag |
<dc:creator> | |
XML attributes/schemes |
- |
سجل في عنصري التنقيح (حقول فرعية، سابقا) المعلومات الواردة عن الناشر. تبين هذه العناصر إسم الفرد، أو المجموعة، أو المؤسسة التي تقوم بضبط أو نشر المادة (ags:publisherName) ومكانها(ags:publisherPlace).
XML content model |
(ags:publisherName | ags:publisherPlace)* | |
XML tag |
<dc:publisher> | |
XML attributes/schemes |
- |
سجل في هذا العنصر تاريخ إتاحة المصدر. يجب أن تستخدم dc:date مع المُعرف الخاص بها (dcterms:dateIssued).
XML content model |
dc:date (dcterms:dateIssued) | |
XML tag |
<dc:date> | |
XML attributes/schemes |
scheme (dcterms:W3CDTF) |
سجل في هذا العنصر معلومات عن موضوع المصدر. ويمكن أن تسجل في نص حر(dc:subject)، أو من خطة تصنيف (ags:subjectClassification) ، أو من معجم مفردات قياسي(ags:subjectThesaurus).
XML content model |
(#PCDATA | ags:subjectClassification | ags:subjectThesaurus)* | |
XML tag |
<dc:subject> | |
XML attributes/schemes |
ags:subjectClassification |
required required required |
يشير هذا العنصر إلى النواحي الوصفية المختلفة للمصدر. ويمكن أن يشتمل ذلك على بيان وجيز، حاشية تفسيرية، تعليق، أو توضيح أي ناحية بالمادة (ags:descriptionNotes)؛ أو نسخة مخصصة رسميا لمجموعة البيانات أو مصدر المعلومات قيد الوصف (ags:descriptionEdition)؛ أو مستخلص يعمل كملخص للوثيقة مصمم لإعطاء المستفيد فكرة أوضح عن محتوى الوثيقة (dcterms:abstract).
XML content model |
(ags:descriptionNotes | ags:descriptionEdition | dcterms:abstract)* | |
XML tag |
<dc:description> | |
XML attributes/schemes |
dcterms:abstract |
optional |
يساعد عنصر تمييز الهوية في تحديد أو/ و تمييز المصدر. ويمكن أن تأخذ الوثيقة العديد من الأرقام. هذا العنصر مخصص للأرقام القياسية المأخوذة من المادة قيد الوصف. ويمكن إدخال بعض الأرقام في شكلها القياسي. بالنسبة لمصادر الويب، يتم إدخال الكود الموحد للمصدر URI (العنوان الإلكتروني الذي يبدأ هكذا: مثلا http:// أو ftp://) في هذا العنصر. لا يتم هنا إدخال الأرقام التي تضعها نظم الفهرسة للأغراض الداخلية، حيث يتم إدخالها في حقل الإتاحة (agls:availability).
XML content model |
dc:identifier (#PCDATA) | |
XML tag |
<dc:identifier scheme="ags:DOI">DOI id</dc:identifier> | |
XML attributes/schemes |
scheme (ags:IPC | ags:RN | ags:PN | ags:ISBN | ags:JN | dcterms:URI | ags:DOI) |
optional |
بالرغم من أن هذا العنصر غير إلزامي، إلا أنه يجب إدخاله كلما أمكن ذلك, إنه يشرح طبيعة أو نوع مكونات المصدر كما أنه يساعد في وصف الفئات العامة، أو الوظائف، أو الأسلوب، أو مستويات تجميع البيانات بمحتوى الوثيقة. كلما أمكن، إختر قيم نوع المادة من قائمة النوعDCMI Type list13. إذا كنت تستخدم معجم قياسي محلي للمفردات، يتم التأكد من عدم استخدام كود فعوضا عن ذلك يتم استخدام كلمات صحيحة لوصف نوع المصدر.
XML content model |
dc:type (#PCDATA) | |
XML tag |
<dc:type>DC Types controlled vocabularies</dc:type> | |
XML attributes/schemes |
scheme (dcterms:DCMIType) |
optional |
يستخدم عنصر النطاق المادي (dcterms:extentdcterms:medium
) للإشارة إلى المادة أو الوعاء المادي للمصدر.XML content model |
dc:format (dcterms:extent | dcterms:medium)* | |
XML tag |
<dc:format> | |
XML attributes/schemes |
- |
بالنسبة لهذا العنصر، يوصى بإدخال الكود ثلاثي الحروف حسب المواصفة ISO639-214. وإذا لم يتيح النظام المحلي إدخال ثلاثة حروف، قم بإدخال الكود ثنائي الحروف، مع الإشارة إلى نظام المواصفة ISO639-115. وإذا لم يكن هناك كود للغة بالنظام المستخدم، قم بإدخال الشكل الكامل للغة دون الإشارة إلى النظام.
XML content model |
dc:language (#PCDATA) | |
XML tag |
<dc:language scheme="ISO639-1">language of resource</dc:language> | |
XML attributes/schemes |
scheme (ISO639-1 | ISO639-2) |
optional |
يستخدم هذا العنصر لربط مصدر بآخر. فهو يتيح بناء علاقات مختلفة بين المصادر ويتيح للمستفيدين تعيين أماكن المصادر ذات الصلة. عند استخدام عنصر العلاقة، من المهم تحديد نوع العلاقة باختيار قيمة من أحد جوانب أي من أنواع عناصر العلاقة الثنائية التالية.
بيان الإتاحة يمد المستفيدين برقم أو كود خاص بمصدر ما، ويساعد على تمييز المصدر داخل المؤسسة. في العادة يتم وضع هذا الرقم بواسطة المؤسسة التي تقتني المادة. وحيث أنها معلومات محلية، يجب على بيان الإتاحة أن يشتمل على إسم أو كود المؤسسة أو المستودع (ags:availabilityLocation) الذي يحتفظ بالمادة والرقم الداخلي (ags:availabilityNumber) الذي يتم به الوصول إلى المصدر محليا.
XML content model |
agls:availability (ags:availabilityLocation, ags:availabilityNumber)* | |
XML tag |
<agls:availability> | |
XML attributes/schemes |
- |
هذا العنصر يقدم (dc:source) الذي يعتبر فيه المصدر الجاري جزء منه. وعند الفهرسة التحليلية، يستخدم هذا العنصر لتوفير معلومات عن توصيف المنفردة (الوحدة الكلية). وتشمل معلومات المرجع التي يمكن إدخالها في هذا العنصر عنوان الوحدة الكلية، بيان مسؤولية الوحدة الكلية؛ الخ.
XML content model |
dc:source (#PCDATA) | |
XML tag |
<dc:source>additional information of resource</dc:source> | |
XML attributes/schemes |
- |
يوفر هذا العنصر (dc:coverage) معلومات عن التغطية الجغرافية (dc:spatial) والزمنية (dc:temporal) للمصدر.
XML content model |
dc:coverage (#PCDATA, dc:spatial, dc:temporal) | |
XML tag |
<dc:coverage>additional information of resource | |
XML attributes/schemes |
dcterms:spatial |
optional optional |
XML content model |
dc:rights (#PCDATA, ags:rightsStatement, ags:rightsTermsOfUse) | |
XML tag |
<dc:rights> | |
XML attributes/schemes |
|
يعتبر هذا العنصر مدخل إلزامي عندما يكون المصدر جزء من مسلسلة (دورية أو سلسلة). وتعرف المسلسلة بأنها مطبوع، عادة ما يكون لها رقم أو تاريخ، ومصممة بقصد استمرار صدورها لفترة غير محدودة. ويمكن أن تتاح على أي وسيط وأن تصدر في أجزاء متعاقبة.
XML content model |
ags:citation (ags:citationTitle | ags:citationIdentifier | ags:citationNumber | ags:citationChronology)* | |
XML tag |
<ags:citation> | |
XML attributes/schemes |
ags:citationTitle |
optional required |
11 In APPENDIX B an instance of an AGRIS AP XML document
12 Codes for the Representation of Names of Languages at http://www.loc.gov/standards/iso639-2/langcodes.html
13
http://dublincore.org/documents/dcmi-type-vocabulary
14 ISO639-2 the three letter language codes http://www.loc.gov/standards/iso639-2/langcodes.html
15 ISO639-1 and ISO639-2 codes
http://www.loc.gov/standards/iso639-2/codechanges.html