tags 相关问题

标签是标记或语义描述符。尽管通用起源,这个“标签”已成为HTML的同义词 - 如果你的问题已经在这个背景下,它的使用可能是不必要的。然而,在不同的上下文中,术语“标签”也可以正式使用。一个案例是SCADA程序Ignition,其中标签是放置在分层系统中的基本单元之一,每个单元都有自己的标签路径和与其他标签相关的标签路径。

[如何比较XML标记值并在它们相同时合并它们? (Python)

我有一个这样的XML文件: [[[[]]]]]]] 如果需要,则没有库: original = ''' <?xml version="1.0" encoding="utf-8"?> <pages> <page id="1" bbox="0.000,0.000,462.047,680.315" rotate="0"> <textbox id="0" bbox="179.739,592.028,261.007,604.510"> <textline bbox="179.739,592.028,261.007,604.510"> <text font="NUMPTY+ImprintMTnum" ncolour="0" size="12.482">C</text> <text font="NUMPTY+ImprintMTnum-it" ncolour="0" size="12.333">A</text> <text font="NUMPTY+ImprintMTnum-it" ncolour="0" size="12.333">P</text> <text font="NUMPTY+ImprintMTnum-it" ncolour="0" size="12.333">I</text> <text font="NUMPTY+ImprintMTnum" ncolour="0" size="12.482">T</text> <text font="NUMPTY+ImprintMTnum" ncolour="0" size="12.482">O</text> <text font="NUMPTY+ImprintMTnum" ncolour="0" size="12.482">L</text> <text font="NUMPTY+ImprintMTnum" ncolour="0" size="12.482">O</text> <text></text> <text font="NUMPTY+ImprintMTnum" ncolour="0" size="12.482">I</text> <text font="NUMPTY+ImprintMTnum" ncolour="0" size="12.482">I</text> <text font="NUMPTY+ImprintMTnum" ncolour="0" size="12.482">I</text> <text></text> </textline> </textbox> </page> </pages> ''' PRE = ''' <?xml version="1.0" encoding="utf-8" ?> <pages> <page id="1" bbox="0.000,0.000,462.047,680.315" rotate="0"> <textbox id="0" bbox="179.739,592.028,261.007,604.510"> <textline bbox="179.739,592.028,261.007,604.510"> ''' POST = '''</text> </textline> </textbox> </page> </pages> ''' import re new_text = '' last_size = 0 first = True for row in re.finditer(r"<text(?: font=\"([^\"]+)\" ncolour=\"0\" size=\"([\d|\.]+)\")*>([\w|\s])*</text>", original): r = row.group(0) font = row.group(1) size = row.group(2) letter = row.group(3) # print(font,size,txt) if size != last_size: if font == None: new_text += " " continue if first: new_text += f"\t\t\t<text font=\"{font}\" ncolour=\"0\" size=\"{size}\">{letter}" first = False else: new_text += f"</text>\n\t\t\t<text font=\"{font}\" ncolour=\"0\" size=\"{size}\">{letter}" else: new_text += letter last_size = size print(PRE + new_text + POST)

回答 1 投票 0


如何在条件下加入XML标记(Python)?

我有一个这样的XML文件: [[[[]]]]]]] 为什么new_text_elem是具有固定属性的硬编码元素?您不知道要分配哪些属性。 尝试以下操作。创建另一个将所有标记写入字典的内部for循环。您也可以遍历标签。 对于下一个元素,检查所有标签是否都在字典中以及它们是否相同。阅读有关字典比较的信息,或仅遍历键并与==比较。 如果它们相同,则将该元素添加到到目前为止找到的相同元素的列表中。然后检查下一个元素。 如果它们不同,则将列表的所有元素添加为新元素,并合并文本。然后清除列表并重新开始。

回答 1 投票 0

将标签添加到带有凭据的Jenkinsfile管道的存储库中

我是Jenkinsfile的新手,我想将我必须拥有的工作传递给Jenkinsfile。我已经成功创建了所需的所有步骤,但是无法像以前使用界面那样将标签添加到git存储库中...

回答 1 投票 0

未执行天蓝色政策

[尝试在Azure中创建与订阅绑定的策略,该策略将拒绝创建没有特定“ costCenter”标记的资源组。我已将以下策略分配给订阅...

回答 1 投票 0

正则表达式:在同一html标记内选择html标记

我有这个html文本: Children 并且我想匹配所有的 标签。我用了这个...

回答 1 投票 -1

在Wordpress中为附件添加标签

我一直想在我的wordpress网站上添加“标记”功能,以便能够标记附件(在媒体文件夹中,例如照片,pdf等)。 WordPress仅具有标准功能...

回答 1 投票 0

如何使用XSLT获取XML标记的值

[下午好,我将以下XML作为输入:-

回答 1 投票 0

在Android中,是否可以在editext中进行这种分隔?

我想在逗号(,)之间创建这种分隔?如StackOverflow标签

回答 1 投票 -1

我的查询为什么不提供单个结果?

我有以下分组查询并具有加号。它仅应返回具有在group by子句中指定的列且其计数由count x指定的行。我认为...

回答 1 投票 0

tkinter tag_add是否在范围重叠时创建单个标签?

我正在编写一个简单的应用程序,该应用程序使用tkinter进行搜索。我已经成功实现了搜索功能,但是发现它找到两个相邻的搜索字段时...

回答 1 投票 0

如何使用Kafka connect s3接收器连接器标记S3存储桶对象

有什么方法可以通过Kafka Connect S3接收器连接器标记写在S3存储桶中的对象。我正在从Kafka中读取消息,并使用S3接收器在S3存储桶中写入avro文件...

回答 1 投票 1

通过堆栈交换api获取标签说明

如何通过堆栈交换api获取stackoverflow的标记说明。] >>

回答 1 投票 0

Vue识别文本模式并替换为href以更正资源

我正在一个项目中,我记录了用户的关键操作。例如,当用户登录到应用程序时,将进行日志输入。我使用Laravel API作为后端,负责...

回答 1 投票 0

无法使用Python使用xml minidom正确删除嵌套的xml标签

我正在尝试使用Python 3.8删除一些表示为字符串并内置在xml.dom.minidom中的xml嵌套标签。结果令人惊讶,解析器仅删除第一个或打开的标签,而留下关闭的标签。 ...

回答 1 投票 0

未从表usin jsoup中获取SQL ID文本值

HTML内容: 以下堆栈溢出答案正在使用Java-HTML库。免责声明是我隶属于该库的代码编写。当需要对HTML Parse,Search,Update或Scrape进行细粒度控制时,它是最有用的。可以通过Google搜索找到。 我在下面的答案中编码了一个答案,该答案在OP发布的问题中抓取了HTML中提供的所有数据。如果需要丢弃这些信息中的任何一个,请从创建的Properties对象中删除多余的表信息。该代码的假定是HTML数据表应具有许多行(确切地说,OP已指定29行),并且每一行和每一列将具有与问题中提供的相同的特征。 在代码末尾,数据被打印到终端。此答案的末尾包含示例输出。 import Torello.HTML.*; import Torello.HTML.NodeSearch.*; import Torello.Java.FileRW; import java.util.*; import java.io.IOException; import java.net.URL; public class SQLID { static final String STARS = "****************************************************************"; static final String SQL = "SQL:"; static final String SQL_ID = "SQL ID:"; static final String EXECUTIONS = "Executions:"; static final String TOTAL_EXECUTION = "Total Execution Time:"; static final String MAX_EXECUTION = "Maximum Execution Time:"; static final String AVG_EXECUTION = "Average Execution Time:"; public static void main(String[] argv) throws IOException { String html = FileRW.loadFileToString("sqlid.html"); // Parses the HTML Page into a Vector of HTMLNode's. Each Node is either an "HTML Element" (class TagNode), or an instance of "class TextNode" Vector<HTMLNode> page = HTMLPage.getPageTokens(html, false); // Retrieves and copies all nodes between <TABLE ID="list-table"> ... and </TABLE> into "table" Vector<HTMLNode> table = InnerTagGetInclusive.first(page, "table", "id", TextComparitor.EQ_CI, "list-table"); // This is the data-table. It is merely a vector of java.util.Properties (inherits java.util.Hashtable) Vector<Properties> sqlInfo = new Vector<>(); // This will iterate rows as Vector<HTMLNode> where each vector is the contents of a row: <TR> ... </TR> HNLIInclusive rows = TagNodeInclusiveIterator.iter(table, "tr"); while (rows.hasNext()) { Properties p = new Properties(); Vector<HTMLNode> row = rows.next(); Vector<HTMLNode> col = TagNodeGetInclusive.first(row, "td"); int pos; // Finds the first instance of "class TextNode" that contains the String "SQL ID:" pos = TextNodeFind.first(col, txt -> txt.contains(SQL_ID)); // Retrieve the contents of that node, and drop the initial substring "SQL_ID:" p.put(SQL_ID, col.elementAt(pos).str.trim().substring(SQL_ID.length()).trim()); // Finds the first instnce of "class TextNode" that contains the String "Executions:" pos = TextNodeFind.first(col, txt-> txt.contains(EXECUTIONS)); // By using "pos + 3", we can skip ahead 2 nodes in the vector (after the </B> element), to get the data-value // According to the HTML, the Data is stored as: <B>Executions: </B> 5 // And this means, the element at "pos + 1" is </B>, and the node at "pos + 2" is what we are looking for. p.put(EXECUTIONS, col.elementAt(pos + 2).str.trim()); // And so on, and so forth... pos = TextNodeFind.first(col, txt -> txt.contains(TOTAL_EXECUTION)); p.put(TOTAL_EXECUTION, col.elementAt(pos + 2).str.trim()); pos = TextNodeFind.first(col, txt -> txt.contains(MAX_EXECUTION)); p.put(MAX_EXECUTION, col.elementAt(pos + 2).str.trim()); pos = TextNodeFind.first(col, txt -> txt.contains(AVG_EXECUTION)); p.put(AVG_EXECUTION, col.elementAt(pos + 2).str.trim()); // The 2nd column in the HTML contains the actual SQL code you are looking for col = TagNodeGetInclusive.nth(row, 2, "td"); p.put(SQL, Util.textNodesString(col).trim()); // Save to the "list of properties" or "vector of properties" sqlInfo.add(p); } // Print the output to the terminal for (Properties p : sqlInfo) { System.out.println(STARS); for (Object property : p.keySet()) System.out.println(String.format("%-" + 25 + "s", property.toString()) + p.get(property)); } } } 以上代码,使用示例HTML表数据将产生的输出输出到Linux / UNIX / Debian等...终端。 **************************************************************** SQL ID: 7w1ahss5vuwv4 SQL: SELECT * FROM (SELECT FndDocumentEntitiesDTEO.DOCUMENT_ENTITY_ID, Executions: 5 Average Execution Time: 1 ms Maximum Execution Time: 1 ms Total Execution Time: 4 ms

回答 1 投票 0

VSCode上的Link + tab快捷方式Emmet-如何获得包含在其中的“类型”?

当我键入快捷方式link + tab以获得链接标记和属性时。它仅显示: 当我想要显示时: ...

回答 1 投票 0

Wordpress-从模板页面中的api调用动态添加元标记

在header.php内部,我进行了api调用以获取数据以设置元信息。 $ title,$ description和$ images是我从api调用中获得的信息。我可以看到从视图中添加的元标记...

回答 1 投票 0

c-wiz标签是什么?

[当我进入Google云端硬盘并查看网页时,我看到了很多标签。这些是什么?它们似乎用于我的用户特定内容(我拥有的文件)。我的浏览器如何知道如何渲染...

回答 1 投票 3

如何手动将堆栈条目推入vim tagstack?

就像标题说的:“如何手动将堆栈条目推入vim标签堆栈?”问题出在这里:我使用gtags / global + unite.vim插件已有一段时间了(顺便说一下,这两个插件是...

回答 3 投票 1

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.