LOGO OA教程 ERP教程 模切知识交流 PMS教程 CRM教程 开发文档 其他文档  
 
网站管理员

C#中文文本匹配,字符串匹配,中文词语匹配,计算2个句子相似度

admin
2023年3月22日 15:50 本文热度 1167

向量在数学上余弦定义如下:

因此我们可以将句子向量话计算句子的余弦相似度。

Public static void Main()

{

  var segmenter = new  JiebaSegmenter();

  var douba = ClassSim.MatchKeywordSim("123", "145");

  Console.WriteLine("【相似度1】:{0}", douba);

  var douba1 = ClassSim.MatchKeywordSim("包皮手术治疗费用怎么治疗?", "包皮手术费用");

  Console.WriteLine("【相似度1】:{0}", douba1);

  var douba2= ClassSim.MatchKeywordSim("包皮手术治疗费用怎么治疗?", "包皮医院");

  Console.WriteLine("【相似度2】:{0}", douba2);  

  Console.ReadKey();

}

然后我们看下使用的匹配方法:

public class ClassSim

{

    public static double MatchKeywordSim(string keyword, string matchkeyword)

    {

        List<char> keywordList = keyword.ToCharArray().ToList();

        List<char> matchkeywordList = matchkeyword.ToCharArray().ToList();

        List<char> unionKeyword = keywordList.union(matchkeywordList).ToList<char>();

        List<int> arrA = new List<int>();

        List<int> arrB = new List<int>();

        foreach (var str in unionKeyword)

        {

            arrA.Add(keywordList.where(x => x == str).Count());

            arrB.Add(matchkeywordList.where(x => x == str).Count());

        }

        double num = 0;

        double numA=0;

        double numB=0;

        for (int i = 0; i < unionKeyword.Count; i++)

        {

            num+=arrA[i]*arrB[i];

            numA+=Math.Pow(arrA[i], 2);

            numB+=Math.Pow(arrB[i], 2);

        }

        double cos = num / (Math.Sqrt(numA) * Math.Sqrt(numB));

        return cos;

    }

}

运行结果:


该文章在 2025/2/24 14:45:18 编辑过
关键字查询
相关文章
正在查询...
点晴ERP是一款针对中小制造业的专业生产管理软件系统,系统成熟度和易用性得到了国内大量中小企业的青睐。
点晴PMS码头管理系统主要针对港口码头集装箱与散货日常运作、调度、堆场、车队、财务费用、相关报表等业务管理,结合码头的业务特点,围绕调度、堆场作业而开发的。集技术的先进性、管理的有效性于一体,是物流码头及其他港口类企业的高效ERP管理信息系统。
点晴WMS仓储管理系统提供了货物产品管理,销售管理,采购管理,仓储管理,仓库管理,保质期管理,货位管理,库位管理,生产管理,WMS管理系统,标签打印,条形码,二维码管理,批号管理软件。
点晴免费OA是一款软件和通用服务都免费,不限功能、不限时间、不限用户的免费OA协同办公管理系统。
Copyright 2010-2025 ClickSun All Rights Reserved