标签 linux 下的文章 - Yuc's Home

登录

标签搜索

yuc

累计撰写 291 篇文章
累计收到 0 条评论

搜索到 22 篇与的结果

2024-08-28
超大文件的修改编辑方法背景想象一个场景，假如有一个导出的数据库纯文本文件需要更改其中一两行的内容，有什么快速有效的办法？服务器配置好的情况下：当文本内容是十几G的时候，我们可以考虑使用 vim 来修改，无非是定位行，搜索关键字，更改后保存慢一些当文本内容是几十G的时候，我们可以考虑使用 sed 等命令搜索更改文本内容，这时候保存是非常慢的，vim几乎处理不了了，并且这些命令会全量的生成临时文件，需要两倍的文件空间，最后替换才能保存成功那么就没有好办法，能够直接修改文件的部分内容，而不需要这么长时间吗，就算仅修改文件起始行的某个字符这样的简单需求方案反向推理，我们需要一个手段能截断文件的内容，让需要修改的部分不要那么大，在修改完成后再合并这些内容即可方案1 最开始我想到的是 split，它能够切割文件，并且它切割的速度是非常快的，假如有一个 270G 的文件需要修改，那么我可以切割成每个文件为 40G 甚至 20G ，在某个文件中修改完指定内容后合并所有文件即可。这里面花费的时间主要有几个：按照每个子文件大小为 20G 切割一个 270G 的文件（这部分也比较慢，raidz3机械400M左右读写需一个小时）找到需要修改的内容，如果内容比较靠前或者靠后那么基本是第一或者最后一个文件修改文件，文件只有20G了，那么修改的速度是可以接收的合并文件（这部分的时间也比较慢，大概670秒）方案2 上面方案中切割文件虽然从理论上比直接修改原文件更好，比如不需要生成全量临时文件，修改的时候只改一部分，时间和操作可控（相对于直接修改270G文件时间是未知数）。但它仍然是有很大的缺陷它仍然需要修改数十G的文件，并且切割和合并慢，总之就是需要操作的还是文件太大那么有没有方法能够把文件的一部分切割出来，修改之后再替换呢？这样似乎就规避了所有的缺点，答案是有的，我们可以使用 dd 来实现。大致的思路如下: 首先我们把文件需要修改的一部分切割下来，这里可以使用 dd or head or tail，这部分的重点是最好能够截断到某一完整的行，所以多几行也是没关系的，原因后面会介绍，然后记录文件的字符数wc -c 接下来修改截断的这部分内容，就算截取了几万行，几十万行，甚至上百万行，这个速度仍然是很快的重点: 修改之前查看文本最后是否存在换行符，如果没有 vim 需要设置 binary, noendofline 这样vim不会自动添加，否则vim会自动添加一个换行符，导致文件格式出现问题接下来调整文件的字节数，保证修改后的文件与截断之前的文件字节数一致，使用 wc -c 确认，如果长度变了，覆盖文本的时候会有问题，举例：原文本是26个字母，然后截取前8个修改内容，但是修改后长度变成了16，那么会覆盖这16个字母到源26个字母中，中间不想被修改的部分也被覆盖了，所以这里重点注意在覆盖文件后，查看处理后的文件，有两个地方要检查，分别是：修改的地方是否成功，覆盖的末尾处是否存在截断或者内容不匹配等实际操作：使用 dd or head or tail 取文件需要修改的附近处，dd 设置 bs=1 大概率不是完整的行，需要设置 vim binary, noendofline ，而 head, tail 一般都是完整的行，可以不需要设置查看文件的字符数，wc -c 修改文件内容，使用你喜欢的方式即可查看新字符数是否跟之前一致，少了则补，多了则删覆盖新文本到原文本 dd if=temp.txt of=access.txt conv=notrunc，最重要的是后面这个参数，一般使用 dd 会把文件覆盖成新文本，就是新文本内容比原文本短的话，多余的会被截断，相当于只会保留新文本，使用这个参数后会保持原文本后面的内容不动
- 2024年08月28日
- 6 阅读
- 0 评论
- 0 点赞
2024-05-31
大量文件传输的方法(海量文件传输) 问题传输文件，如果只是大文件传输，还是比较容易的，基本上网络、磁盘很容易能够到达满速，只要想办法提升这两方面就可以更快的传输。但是如果是海量的小文件、大量文件，那么基于磁盘寻址的速度，IO受限会很高，并且同时会在网络上给予相同的限制这里我们说说如何在海量文件、大量文件中尽可能的提升传输速度方案本机不同磁盘复制目录 tar cvf – /home/src_dir | tar xvf - -C /opt 复制文件 tar cf – access.log |tar xf - -C /opt 不同主机用nc来监听一个端口，任意都行，只要不被占用；并且将收到的数据用tar展开。-l 代表监听模式 nc -l 34183 | tar -C /data1datasets/norm/ -zxf - 接着在发送端上通过nc和 tar发送data_01目录。使用一致的34183的端口 tar -zcvf - data_01 | nc 192.168.0.1 34183 PS. 其他辅助手段以上很多工具都是单线程的，并且不一定能充分利用cpu、io来专门处理这个事情，所以可以换一个角度来思考，如果子目录进行了分级，那么可以先对一个子目录调用上面的方法，如果观察到cpu、io资源还比较充足，那么可以同时对其他子目录进行操作，使用并行的方式继续提升速度
- 2024年05月31日
- 4 阅读
- 0 评论
- 0 点赞
2024-05-07
centos内核版本升级参考文档 http://elrepo.org/tiki/tiki-index.php?utm_source=hacpai.com 操作步骤 yum -y install yum-plugin-fastestmirror && \ rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org && \ yum install https://www.elrepo.org/elrepo-release-7.el7.elrepo.noarch.rpm && \ yum --enablerepo=elrepo-kernel install kernel-ml centos7查看当前可以使用的内核 awk -F\' '$1=="menuentry " {print $2}' /etc/grub2.cfg 查看当前使用的内核版本 uname -r 或 uname -a 一般可以看到最新安装的内核是排在第一位的，并且第一个的编号为0开始，要想切换到则使用命令： grub2-set-default 0 因为grub2的配置文件 /etc/default/grub 中默认配合的应该是 GRUB_DEFAULT=saved，意思是说根据设置来选择启动项或者可以修改配置文件 GRUB_DEFAULT=0 意思是第0个，也就是最新的 PS. centos6目前最多只能升级到4.4，centos7,8可以升级到更高的内核版本，后续需要更换为centos7，采用较新的内核ml主线版本内核升级，如果没有升级到最新版，可能是因为yum源里面有的地址没有同步最新版，而本地升级的时候解析到这个仓库去了 yum --enablerepo=elrepo-kernel install kernel-lt 升级后修改/boot/grub/grub.conf，一般新内核顺序为0 查询目前有几个版本内核 egrep ^menuentry /etc/grub2.cfg | cut -f 2 -d \' 设置默认的启动内核 grub2-set-default 'CentOS Linux (5.4.262-1.el7.elrepo.x86_64) 7 (Core)' 查询是否生效 grub2-editenv list
- 2024年05月07日
- 6 阅读
- 0 评论
- 0 点赞
2024-04-25
bash漏洞CVE-2014-6271 验证方法 env x='() { :;}; echo Vulnerable CVE-2014-6271 ' bash -c "echo test" 解决办法升级到4.4.18版本
- 2024年04月25日
- 395 阅读
- 0 评论
- 0 点赞
2024-04-08
Linux区分uefi启动还是bios启动 0x00 FFFFFF Linux 下即使存在 /boot/efi 目录（无文件）、存在 sda1 这个 1M 左右的分区也是不能确定是 uefi 模式启动的，以下有两种方式确定: 通过判断系统是否加载 efi 相关的文件是否存在目录/sys/firmware/efi/ 日志中是否存在 efi 关键字 (不推荐的方法) dmesg | grep -i 'efi'
- 2024年04月08日
- 6 阅读
- 0 评论
- 0 点赞