如何在 google colab 中读取 .docx 文件?

问题描述 投票:0回答:2

我正在尝试将 docx 文件读入 google collab,因为我的带有 anaconda 的主计算机已进行维护。我正在尝试使用 python-docx 模块,但据我所知,我不能只在 google collab 中 pip install python-docx

'''

import docx

def getText(filename):
    doc = docx.Document(filename)
    fullText = []
    for para in doc.paragraphs:
        fullText.append(para.text)
    return '\n'.join(fullText)

docxString = getText("week_8_document1.docx")

'''

有什么想法吗?

python python-3.x google-colaboratory google-docs file-read
2个回答
1
投票

尝试以下操作;希望它有效:

#Install python-docx
!pip install python-docx #<-- Yes you can directly install in Colab

#Import the tools
import docx
from google.colab import files

uploaded = files.upload() #<-- Select the file you want to upload
file_name = '[whatever your file is called here].docx' #<-- Change filename to your file
doc = docx.Document(file_name)

加载文档后,您可以按段落或表格等访问文本。祝老板好运


0
投票

我非常同意第 17 页,尊重 saisir 的格式单词,并执行后续计划:

  1. 简介 互联网安全重要性的一般介绍。 网络安全的实际问题和解决方案。 融洽关系的目标。
  2. 互联网安全游戏 2.1 威胁和漏洞

威胁类型:病毒、恶意软件、勒索软件、攻击 DDoS 等。 系统和网络的漏洞。 网络攻击对企业和个人的影响。 2.2 保护受捐者人员

受赠人保护法规(RGPD、CCPA 等)。 侵犯他人的行为是危险的。 受害者和企业的后果。 2.3 政府和机构的角色

Cadre légal et réglementaire。 国家和国际加强安全倡议。 公共和私人部门之间的合作。 3. 就地安全措施 3.1 房地产和系统安全化

防火墙、VPN、IDS/IPS。 Chiffrement des données entransit et au repos。 今日系统和逻辑的管理。 3.2 身份和权限的管理

多重认证。 管理过去的事情。 控制访问权限和权限。 3.3 应用程序网络安全化

API 安全化。 预防XSS、SQL注入、CSRF等攻击 SSL/TLS 证书的使用。 3.4 使用者的感化和形成

网络安全形成的重要性。 雇员和使用者的敏感性计划。 安全文化的发展。 4. 确保信息和社区保护 4.1 主动保护策略

继续对系统进行监视。 入侵测试和安全审计。 采取严格的安全政治措施。 4.2 事件响应和危机处理

事件响应计划。 病后恢复。 违反安全规定的通信。 4.3 社区的参与度和透明度

针对安全措施主动沟通。 安全事件的透明度。 与使用者的保护者的接触。 5. 卡斯练习曲 分析违反安全的具体情况。 Leçons tirées et bonnes pratiques 收养套件和事件。 对企业和使用者的影响。 六、结论 安全讨论的实施和措施综合。 整体安全方法的重要性。 网络安全的未来展望。

© www.soinside.com 2019 - 2024. All rights reserved.