相似性度量量化了对象(例如文档,特征向量)的相似程度。
给出的是文本文件列表。每个文本文件描述一个主题。输入是我用几句话描述的一个心理概念。 文本文件包含变音符号。 该算法应该输出 fi...
来自 rtstruct dicom 文件的两个 3D 数组之间的 Dice 相似度索引
大家好,我创建了一个评估骰子相似度指数(DSC)的脚本,但我不确定该脚本。选择结构后我想计算它们的 DSC 我定义了两个函数 第一个到
我有以下数据: 目的 l2a l2b l4 l5 A 0.6649 0.5916 0.033569 0.557373 乙 0.8421 0.5132 0.000000 0.697193 C 0.6140 0.2807 0.084217 0.650313 d 0.7619 0.3810 0.000000 0.6623...
我有以下数据: 目的 l2a l2b l4 l5 A 0.6649 0.5916 0.033569 0.557373 乙 0.8421 0.5132 0.000000 0.697193 C 0.6140 0.2807 0.084217 0.650313 d 0.7619 0.3810 0.000000 0.6623...
如何让 Weaviate 返回先前与另一个矢量化字符串关联的固定文本字符串?
我正在尝试使用Weaviate作为缓存,从而创建一个包含矢量形式的文本“键”和关联的文本字符串值(不是矢量形式)的对象,以便我稍后可以查询...
我有一个小型数据库,其中包含部落冲突基地的图像。我想要的是将部落冲突基地上传到系统,系统应该搜索数据库图像并返回一些
我有两个 3D 分布,我想对这两个样本运行 Kolmogorov-Smirnov 测试来测量它们的相似性。 scipy.stats 实现了 1
我有大量的文本,我需要将它们相互比较以检查它们是否相似。每篇文章长约10000字。 因此我将预先计算......的哈希值
我有两个表,其中包含早期阶段 (TIMEPOINT_1) 和后期阶段 (TIMEPOINT_2) 的 DNA 序列。我想从 TIMEPOINT_1 表中过滤 TIMEPOINT_2 表中的序列...
我尝试在我的 django 项目中使用 TrigramSimilarity 来查询它的搜索结果,但它给了我一个如下错误: 函数相似度(文本,未知)不存在 第 1 行:... 计数(...
我有这个用户集合: { "_id" : ObjectId("501faa18a34feb05890004f2"), “用户名”:“joanarocha”, } { "_id" : ObjectId("501faa19a34feb05890005d3"), “用户名”:“
我有以下向量: 将 numpy 导入为 np my_vector = np.array([0.001, -0.05, 0.3, 0.5, 0.01, -0.03]) 有人可以建议一种方法来随机生成相似的向量,只需稍微
我有一个问题,我需要比较图像中出现的形状。 这些图像可能显示相同的内容,但它们的内容可能会被扭曲、翻转……因此,传统算法会……
我有一个 subtitle.srt 文件,但其内容并不准确。与此同时,我还有一组准确但时间不同步的段落。 不准确可能会导致...
如何在Python中找到具有相似度分数的大字符串中的相似子字符串?
我正在寻找的不仅仅是两个文本之间的简单相似度分数。而是字符串内子字符串的相似度得分。说: text1 = '猫正在垫子上睡觉'。 text2 = '猫是
我有 2 个 HTML 页面 1.一个完整的HTML页面。我们称这个源页面 2. 一个类似于源页面一小部分的HTML小页面(子页面)。 例子 源页面 这是一个... 我有 2 个 HTML 页面 1.一个完整的HTML页面。我们称这个源页面 2. 一个类似于源页面一小部分的小HTML页面(子页面) 例子 源页面 <div> This is a source page </div> 子页面 <div> This is blank page </div> 这里我们有一个类似于源页面的子页面。 它可能不完全在源页面内。这意味着子页面可能不完全是源页面的子字符串,但子页面和源页面的某些部分会相交。 我需要突出显示源页面内的子页面。 我正在考虑使用图表来查找单词(节点)之间的相似性并在源页面中找到开始和结束节点。 这不是具体的,只是一个想法。 任何建议/实施都会有所帮助。 我正在使用 Java 来实现。
在有向浅图中,有哪些指标可以计算两个“根”节点之间的“相似度”?
我在 networkX 中构建了一个图形。该图有两种类型的节点,A 和 B。A 节点可以有到 B 节点的有向边。 B 节点没有任何出边。基本上该图代表参考...
我正在做一个涉及计算句子相似度的项目。句子中每个标记的上下文向量是使用 Hugging Face 的 BERT 生成的。下面的代码返回所有令牌
当这些单元格包含多个值时,是否有一种方法可以比较相同数据框的列值的相似程度?
我有一个 GO 通路的数据框以及在每个通路中活跃的相应基因。每条路径及其数据都是数据框的一行。目前,所有与通路相关的基因都......
我有一个数据框如下:框架的形状是(1510, 1399)。列代表产品,行代表用户为给定产品分配的值(0 或 1)。我怎样才能计算