Retrieval-Augmented Generation is Emerging as a Key Strategy for Deploying GenAI Applications
Dubai, UAE, June 3, 2025 — Gartner Inc. predicts that organizations will develop 80% of Generative AI (GenAI) business applications on their existing data management platforms by 2028. This approach will reduce the complexity and time required to deliver these applications by 50%.
Prasad Pore, Sr Director Analyst at Gartner, said, “Building GenAI business applications today involves integrating large language models (LLMs) with an organization’s internal data and adopting rapidly evolving technologies like vector search, metadata management, prompt design and embedding. However, without a unified management approach, adopting these scattered technologies leads to longer delivery times and potential sunk costs for organizations.”
As organizations aim to develop GenAI-centric solutions, data management platforms must evolve to integrate new capabilities or services for GenAI development, ensuring AI readiness and successful implementation.
Enhancing GenAI Application Deployment With RAG
Retrieval-augmented generation (RAG) is becoming a cornerstone for deploying GenAI applications, providing implementation flexibility, enhanced explainability and composability with LLMs. By integrating data from both traditional and non-traditional sources as context, RAG enriches the LLM to support downstream GenAI systems.
“Most LLMs are trained on publicly available data and are not highly effective on their own at solving specific business challenges,” said Pore. “However, when these LLMs are combined with business-owned datasets using the RAG architectural pattern, their accuracy is significantly enhanced. Semantics, particularly metadata, play a crucial role in this process. Data catalogs can help capture this semantic information, enriching knowledge bases and ensuring the right context and traceability for data used in RAG solutions.”
To effectively navigate the complexities of GenAI application deployment, enterprises should consider these key recommendations:
- Evolve Data Management Platforms: Evaluate whether current data management platforms can be transformed into a RAG-as-a-service platform, replacing stand-alone document/data stores as the knowledge source for business GenAI applications.
- Prioritize RAG Technologies: Evaluate and integrate RAG technologies such as vector search, graph and chunking, from existing data management solutions or their ecosystem partners when building GenAI applications. These options are more resilient to technological disruptions and compatible with organizational data.
- Leverage Metadata for Protection: Enterprises should leverage not only technical metadata, but also operational metadata generated at runtime in data management platforms. This approach helps protect GenAI applications from malicious use, privacy issues and intellectual property leaks.
Gartner CIO & IT Executive Conference
Gartner analysts will provide additional analysis on insights and trends shaping the future of IT and business, including accelerating business transformation, application modernization, infrastructure and operations at the Gartner CIO & IT Executive Conference, taking place September 22-24 in São Paulo and October 6-8 in Dubai. Follow news and updates from the conference on X using #GartnerCIO.
About Gartner for Data & Analytics Leaders
Gartner for Data & Analytics Leaders provides actionable, objective insight to CDAOs and data & analytics leaders to help them accelerate their D&A strategy and operating model to increase business value. Additional information is available at https://www.gartner.com/en/
Follow news and updates from Gartner for D&A Leaders on X and LinkedIn using #GartnerDA. Visit the Gartner Newsroom for more information and insights.
جارتنر: 80% من تطبيقات الذكاء الاصطناعي التوليدي للأعمال سيتم تطويرها على المنصات الحالية لإدارة البيانات بحلول عام 2028
دبي، الإمارات العربية المتحدة – 3 يونيو 2025: كشفت أحدث توقعات شركة جارتنر للأبحاث أن المؤسسات ستقوم بتطوير نحو 80% من تطبيقات الذكاء الاصطناعي التوليدي للأعمال على منصات إدارة البيانات التي لديها بحلول عام 2028. وسيسهم هذا التوجه في خفض مستوى التعقيدات وتقليل الوقت اللازم لنشر هذه التطبيقات بنحو 50%.
وقال براساد بور، المحلل والمدير الأول لدى جارتنر: "ينطوي إنشاء تطبيقات الذكاء الاصطناعي التوليدي للأعمال في الوقت الراهن على دمج نماذج اللغات الكبيرة (LLM) مع البيانات الداخلية للمؤسسات واعتماد تقنيات دائمة التطور مثل البحث الدلالي (Vector Search)، وإدارة البيانات الوصفية، وتصميم الأوامر المخصصة للذكاء الاصطناعي ودمجها في التطبيقات. إلا أنه وبدون وجود توجه موحد للإدارة، فإن اعتماد مثل هذه التقنيات المتفرقة قد يؤدي إلى إطالة الفترات اللازمة للنشر والتكاليف المحتملة التي قد تتكبدها المؤسسات".
وبالتزامن مع تطلع المؤسسات إلى تطوير حلول متمحورة حول الذكاء الاصطناعي التوليدي، فإنه يجب على منصات إدارة البيانات أن تتطور من أجل دمج القدرات أو الخدمات الجديدة التي تسهم في تطوير الذكاء الاصطناعي التوليدي، وضمان جاهزيتها لاستيعاب الذكاء الاصطناعي التوليدي والتنفيذ الناجح.
تحسين تطوير تطبيقات الذكاء الاصطناعي التوليدي بواسطة التوليد المعزز بالاسترداد (RAG)
يشهد الوقت الحالي تحول التوليد المعزز بالاسترداد إلى حجر الزاوية في نشر تطبيقات الذكاء الاصطناعي التوليدي وتوفير مرونة في النشر وتحسين إمكانية الشرح والتوضيح (Explainability) وقابلية التشكيل والتكوين (Composability) وذلك بواسطة توظيف نماذج اللغات الكبيرة. ومن خلال دمج البيانات من المصادر التقليدية وغير التقليدية بحسب السياق، فإن التوليد المعزز بالاسترداد يسهم في إثراء نماذج اللغات الكبيرة ودعم أنظمة الذكاء الاصطناعي التوليدي الجاهزة للاستخدام.
وأضاف بور: "يتم تدريب معظم نماذج اللغات الكبيرة على البيانات المتاحة للعموم التي لا تعتبر فعالة كثيراً في إيجاد حلول للتحديات المحددة التي تواجه قطاع الأعمال، إلا أنه عند جمع نماذج اللغات الكبيرة مع مجموعات البيانات المملوكة من قبل المؤسسات باستخدام الأنماط الهيكلية للتوليد المعزز بالاسترداد، فإن دقتها تتحسن بشكل كبير. وتؤدي الدلالات في هذا السياق، وخاصة البيانات الوصفية (Metadata) دوراً بالغ الأهمية إذ تُسهم فهارس البيانات (Data Catalogs) في تجميع هذه المعلومات الدلالية ما يساعد في إثراء القواعد المعرفية وضمان السياق الصحيح وإمكانية تتبع البيانات المستخدمة في حلول التوليد المعزز بالاسترداد".
وحتى تتمكن المؤسسات من تجاوز تعقيدات نشر تطبيقات الذكاء الاصطناعي التوليدي بشكل جماعي، فإنه يجب عليها أخذ هذه الاعتبارات الرئيسية بعين الاعتبار:
- تطوير منصات إدارة البيانات: إجراء تقييم حول ما إذا كان بالإمكان تحويل منصات إدارة البيانات الحالية إلى منصات "التوليد المعزز بالاسترداد المقدم كخدمة" (RAG-as-a-service) وذلك حتى تحل مكان مستودعات الوثائق/البيانات المنفصلة كمصدر معرفي لتطبيقات الذكاء الاصطناعي التوليدي للأعمال.
- إعطاء الأولوية لتقنيات التوليد المعزز بالاسترداد: تقييم تقنيات التوليد المعزز بالاسترداد مثل البحث الدلالي (Vector Search)، والرسم البياني (Graph)، وتجزئة البيانات (Chunking)، ودمجها ضمن حلول إدارة البيانات الحالية أو من خلال شركاء المنظومة وذلك عند إنشاء تطبيقات الذكاء الاصطناعي التوليدي. وتعد هذه الخيارات أكثر قدرة على التكيّف مع التغيرات الجذرية في التكنولوجيا ومتوافقة مع بيانات المؤسسة.
- الاستفادة من البيانات الوصفية بغرض الحماية: ينبغي للمؤسسات الاستفادة ليس فقط من البيانات الوصفية التقنية، بل أيضاً من البيانات الوصفية التشغيلية التي يتم توليدها أثناء تشغيل منصات إدارة البيانات. ويساعد هذا التوجه في حماية تطبيقات الذكاء الاصطناعي التوليدي من الاستخدامات الخبيثة، وتحسين الجوانب المتعلقة بالخصوصية، وتقليل تسريبات الملكية الفكرية.