Ronan Blog

罗华东的博客 | 永远相信美好的事情即将发生

「图床」上传脚本,基于 GitHub 仓库

2024-09-03 Docs Ronan

使用之前需要通过 pip install PyGithub 安装 github 库

35-37 行填入相应信息并将代码保存为 imgs.py:

  • owner:github 用户名
  • repo:仓库名(如 imgs)
  • token:github 私人访问令牌(要给予仓库读写权限)

可以通过以下方法直接运行脚本或者将脚本打包为应用程序

使用方法:usage: python imgs.py [-h] input_file [input_file ...]

from github import Github
import os
import argparse
import base64

class Imgs:
    def __init__(self, owner=None, repo=None, token=None):
        self.owner = owner
        self.repo = repo
        self.token = token

        g = Github(self.token)
        self.repo = g.get_repo(f"{self.owner}/{self.repo}")

    def create_new_file(self, img, content):
        # 第一个参数:要上传到仓库的哪个路径; 第二个参数:commit 信息; 第三个参数:上传文档正文; 第四个参数:上传的分支
        self.repo.create_file(f"blog_imgs/{img}", f"Newfiles: {img} ", content, branch="main")

    def get_img_content(self, img_path):
        with open(img_path, "rb") as image_file:
            img_content = image_file.read()

        return img_content


def main():
    parser = argparse.ArgumentParser(description="基于 echozap/imgs 的图床上传")

    # 传递的图片数量不确定
    parser.add_argument('input_file', type=str, nargs='+', help='输入图片的路径')

    args = parser.parse_args()

    img = Imgs(
        owner = "",
        repo = "",
        token = ""
    )

    for img_path in args.input_file:
        try:
            img_content = img.get_img_content(img_path)
            img_name = os.path.basename(img_path) # 获取带扩展名的文件名

            img.create_new_file(img_name, img_content)

            print(f"{img_name}上传成功")
            print(f"https://img.ronan.us.kg/blog_imgs/{img_name}")
        except Exception as e:
            if '"status": "422"' in str(e):
                print(f"上传 {img_path} 时发生错误: {e}")
                print("图片已存在")
                print(f"https://img.ronan.us.kg/blog_imgs/{img_name}")

if __name__ == "__main__":
    main()

「图床」md 图片链接替换

2024-09-03 Docs Ronan

在 main 函数的 old_domain 为旧的图片链接,new_domain 是新的图片链接,根据自身情况填写。

将以下代码保存为 re.py ,使用方法:usage: re.py [-h] input_dir,参数是一个目录路径。

import os
import argparse
import re

class LinkReplace:
    def __init__(self, old_domain=None, new_domain=None, input_dir=None):
        self.old_domain = old_domain
        self.new_domain = new_domain
        self.input_dir = input_dir

        if not self.old_domain or not self.new_domain or not self.input_dir:
            raise ValueError("Both old_domain and new_domain must be provided")

    def replace_ibl_in_md(self): # 替换 md 文档的图片链接
        # 匹配 Markdown 文件中的图片链接的正则表达式
        image_pattern = re.compile(r'!\[.*?\]\((.*?)\)')

        for file_name in os.listdir(self.input_dir):
            # 拼接完整的文件路径
            file_path = os.path.join(self.input_dir, file_name)

            if file_path.endswith('md'):
                # 打开并读取文件内容
                with open(file_path, 'r', encoding='utf-8') as f:
                    content = f.read()

                # 查找符合条件的图片链接
                links = image_pattern.findall(content)

                modified = False

                # 遍历找到的链接
                for link in links:
                    if self.old_domain in link:
                        # 只替换包含 old_domain 的链接
                        updated_link = link.replace(self.old_domain, self.new_domain)
                        content = content.replace(link, updated_link)
                        modified = True

                    # 如果内容有更改,则写回文件
                    if modified:
                        with open(file_path, 'w', encoding='utf-8') as f:
                            f.write(content)
                        print(f"Updated links in: {file_path}")

    def get_ibl_in_md(self): # 输出 md 文档中所有的图片链接
        # 匹配 Markdown 文件中的图片链接的正则表达式
        image_pattern = re.compile(r'!\[.*?\]\((.*?)\)')

        for file_name in os.listdir(self.input_dir):
            # 拼接完整的文件路径
            file_path = os.path.join(self.input_dir, file_name)

            if file_path.endswith('md'):
                # 打开并读取文件内容
                with open(file_path, 'r', encoding='utf-8') as f:
                    content = f.read()

                # 查找符合条件的图片链接
                link = image_pattern.findall(content)

                if link:
                    print(f"{file_path}: {link}")

def main():

    parser = argparse.ArgumentParser(description="传入一个目录,替换目录下所有 md 文档的图片链接")
    parser.add_argument("input_dir", help="输入目录路径")

    args = parser.parse_args()

    # 要替换的域名
    old_domain = ""
    new_domain = ""

    lr = LinkReplace(old_domain, new_domain, args.input_dir)

    lr.replace_ibl_in_md()
    lr.get_ibl_in_md()


if __name__ == "__main__":
    main()

RonanBlog 备份自动化

2024-09-03 Docs Ronan

本文仅适用于Huxpro 博客及其模板 !!!

准备 backup.py 以及 backup

1.在 仓库根目录 下新建一个 backup 空目录,「为防止 github 自动忽略空目录,所以可以在backup 里面随便新建一个 t.md」
2.将以下代码保存为 backup.py 并且放置到 仓库根目录

backup.py 源码:

import os
import re
import argparse

class Backup:

    def __init__(self, source_path, backup):
        # 备份的文档路径
        self.backup = backup
        # 带日期前缀的博文目录
        self.source_path = source_path

    def process_file(self, file_name):
        # 去掉文件元数据和名称前面的日期

        removing_date_file = re.sub(r'^\d{4}-\d{2}-\d{2}-', '', file_name)

        # 读取文件内容并移除 YAML 前置事项
        with open(f"{self.source_path}/{file_name}", 'r', encoding='utf-8') as file:
            content = file.read()

        # 使用正则表达式找到并去掉第一个以“---”分隔的部分
        content = re.sub(r'^---.*?---\s*', '', content, flags=re.DOTALL)

        # 将修改后的内容写入新的文件
        with open(f"{self.backup}/{removing_date_file}", 'w', encoding='utf-8') as new_file:
            new_file.write(content)

    def delete_old_file(self):
        # 获取 backup 目录下的所有 md 文件
        backup_files = {f for f in os.listdir(self.backup) if f.endswith('.md')}

        # 获取 _posts 目录下的所有 md 文件
        source_files = {f for f in os.listdir(self.source_path) if f.endswith('.md')}

        # 获得_posts 目录下去除日期后的文件名的集合
        intermediate_name = {re.sub(r'^\d{4}-\d{2}-\d{2}-', '', f) for f in source_files}

        # 找出在 backup 目录中但不在 source 目录中的文件
        unmatched_files = backup_files - intermediate_name

        # 删除这些不一致的文件
        for file_name in unmatched_files:
            file_path = os.path.join(self.backup, file_name)
            os.remove(file_path)

    def get_post_name(self) -> list[str]:

        post_names = []
        for post_name in os.listdir(self.source_path):
            if post_name.endswith('.md') or post_name.endswith('.txt'):
                post_names.append(post_name)

        return post_names

def main():
    parser = argparse.ArgumentParser(description='Process a file to remove date from filename and YAML front matter.')

    # 添加一个位置参数来接受文件路径
    parser.add_argument('source_path', type=str, help='需要备份的目录')
    parser.add_argument('backup', type=str, help='备份文件存放的目录')

    # 解析命令行参数
    args = parser.parse_args()

    # 创建 Backup 类的实例
    backup = Backup(args.source_path, args.backup)
    post_names = backup.get_post_name()

    for post_name in post_names:
        backup.process_file(post_name)

    backup.delete_old_file()

    print("backup succeed")

if __name__ == '__main__':
    main()

修改actions

将仓库根目录下的 .github/workflows/jekyll.yml 内容修改为:

Continue reading
Older posts Newer posts