为提升基于RAG(Retrieval Augmented Generation)架构的智能问答系统文本召回率,研究分析了当下常用的文本向量化策略。针对各种策略存在的上下文语义不连贯及词嵌入后其向量中被引入噪声等问题,提出了一种语义特征空间模型以及利用文本要点进行语义检索的向量化策略。通过该模型分析并证明基于文本要点策略构造的语义特征空间能更好的逼近领域知识空间,并得到将文本向量投影到低秩语义特征空间进行语义检索可以提高文本召回率的方法。整体应用该模型、策略、方法形成的方案优化改进了RAG架构,实验结果显示文本召回率较传统的RAG架构得到了显著提高,以大语言模型为底座实现科技政策法规智能问答。该方案进一步完善了RAG应用开发技术栈,语义特征空间可应用于改进向量数据库的搜索算法。