الالمعرف الكيميائي الدولي (
بالإنجليزية: IUPAC International Chemical Identifier) ويرمز له (InChI) وتلفظ (
إنشي) وهي تعريفات نصية
للمواد الكيميائية، مصممة لكي تعطي طريقة معيارية مقروءة بشريا تستخدم لتشفير المعلومات الجزيئية بحيث تسهل البحث عن هذه المعلومات في قواعد البيانات، وعلى
الشبكة العنكبوتية. وقد طورها
الاتحاد الدولي للكيمياء البحتة والتطبيقية و
المعهد الوطني للمعايير والتقنية (
National Institute of Standards and Technology) خلال الأعوام 2000-2005، حيث الشكل والخوارزميات غير مسجلة الملكية والبرمجيات مجانية تحت رخصة
مفتوحة المصدر LGPL (رغم أن مصطلح "InChI" هي علامة تجارية للاتحاد الدولي للكيمياء البحتة والتطبيقية).
[1]/
] نظرة شاملةتصف المعرفات المواد الكيميائية باعتبارها "
طبقات" من المعلومات، تتعلق بالذرات وروابطها، ومعلومات
المماثل الكيميائي (tautomer)، و معلومات
النظائر، و
الكيمياء الفراغية، والمعلومات عن الشحنة الإلكترونية. ليس من الواجب تقديم جميع الطبقات؛ على سبيل المثال، يمكن إغفال طبقة
المماثل الكيميائي ( tautomer) إذا كان هذا النوع من المعلومات غير متصل بتطبيق معين.
تختلف المعرفات الكيميائية الدولية عن
أرقام التسجيل كاس في عدد من الجوانب وهي:
- أنها قابلة للاستخدام بحرية وبدون ملكية؛
- يمكن حسابها من المعلومات الهيكلية وليس من الضروري أن تكون منظمة من قبل بعض المنظمات؛
- معظم المعلومات في إنشي مقروءة بشريا (لمن يمارسها).
يمكن النظر إلى
إنشي على أنها نسخة رسمية وعامة للغاية من
تسمية الاتحاد الدولي للكيمياء البحتة والتطبيقية. يمكن للمعرفات الكيميائية الدولية التعبير عن مزيد من المعلومات مقارنة بترميز
مواصفات الإدخال النصي المبسط للجزيئات، وتختلف في أن كل بنية هيكلية لها سلسلة
إنشي وحيدة وهو أمر هام في تطبيقات قواعد البيانات. المعلومات عن الإحداثيات ثلاثية الأبعاد للذرات غير ممثلة في
الإنشي، ولهذا الغرض يمكن استخدام نمط مثل
بنك معلومات البروتينات (
Protein Data Bank).
إن
خوارزمية إنشي تحول المعلومات الهيكلية المدخلة إلى معرف إنشي وحيد في عملية ثلاثية الخطوات: التسوية (normalization) (لإزالة المعلومات الزائدة)، التمثيل القانوني (canonicalization) (لتوليد عنوان عددي وحيد لكل ذرة)، والتسلسل (serialization)(لتقديم سلسلة من الحروف).
إن
مفتاح الإنشي (InChIKey)، ويشار إليه أحيانا (Hashed InChI)، هو تمثيل رقمي مكثف ثابت الطول (25 محرفا) للإنشي لايمكن للإنسان فهمه. وقد أصدرت مواصفات مفتاح الإنشي في أيلول 2007 من أجل تسهيل عمليات البحث على الشبكة العالمية عن المركبات الكيميائية، لأنها كانت تسبب بعض المشاكل مع الطول الكامل للإنشي.
[2][] أمثلةCH3CH2OH إيثانول | InChI=1/C2H6O/c1-2-3/h3H,2H2,1H3 |
L-حمض الأسكوربيك | InChI=1/C6H8O6/c7-1-2(8)5-3(9)4(10)6(11)12-5/h2,5,7-10H,1H2/t2-,5+/m0/s1 |
[ بنية الإنشي والطبقاتيبدأ كل
إنشي بالشكل المحرفي "
InChI =" يليه رقم النسخة، وهي حاليا 1. تنظم بقية المعلومات وفق سلسلة من الطبقات والطبقات الثانوية، حيث تقدم كل طبقة نوعا واحدا ومعينا من المعلومات. يفصل خط مائل طبقات "/" بين الطبقات والطبقات الثانوية، وتبدأ بحرف معين ومميز (باستثناء الطبقة الثانوية للصيغة الكيميائية للطبقة الرئيسية). إن الطبقات الست مع الطبقات الثانوية الهامة هي:
- الطبقة الرئيسية
- الصيغة الكيميائية (بدون بادئة). وهذه هي الطبقة الثانوية فقط الني يحب أن تكون موجودة في كل إنشي.
- ارتباطات الذرة (البادئة : "c"). الذرات في الصيغة الكيميائية (باستثناء ذرات الهيدروجين) ترقم بالتسلسل؛ هذه الطبقة الثانوية تصف أي من الذرات مرتبطة مع الذرات الأخرى.
- ذرات الهيدروجين (البادئة : "h"). تصف كيفية ارتباط ذرات الهيدروجين مع كل من الذرات أخرى.
طبقة الشحنة.
- طبقة ثانوية مشحونة إيجابيا (البادئة : "p")
- طبقة ثانوية مشحونة سالبيا (البادئة : "q")
طبقة كيميائية فراغية
طبقة النظائر
طبقة H الثابتة
طبقة إعادة التوصيل