我正在尝试制作一个使用OCR来在线扫描测验的“测验扫描仪”,以便我自己可以从在线资源中编译测验,以便能够离线回答它们。我已经厌倦了复制和粘贴的事情,而只是使用OCR。
到目前为止,我的OCR部分没有问题。我现在遇到麻烦的部分是我需要将问题与选择以及正确和错误的选择分开。下面是我试图分离它们的简化代码。
我需要将它们分开,因为我想将其导出到excel中的电子表格。像往常一样真的需要您的帮助stackoverflow社区
import re
scannedmcq = 'Insert Question Here @ A(correct) > B > C > D' #Output of my OCR script
# What if this is the new string
# 'Insert Question Here > A > B > C @ D'
# The Delimiter @ Is the correct answer while > is the wrong answer
# How to Identify and print which part of the string has the delimiter @
text = re.split(r'[@>]\s*', line)
# Manually Printing the strings
print(text[0])
print(text[1])
print(text[2])
print(text[3])
print(text[4])
尝试在字符串中查找@
字符的索引,然后在分开两个索引之后才是正确的答案。
scannedmcq = 'Insert Question Here @ A(correct) > B > C > D'
result = scannedmcq[scannedmcq.index('@')+2]
print("Correct Answer is':", result)