文本编辑器打开大(巨型,巨大,大)文本文件

个人意思是100+ MB大; 这样的文本文件能够推挤编辑人员的范围。 php

我须要浏览一个大的XML文件,可是若是编辑器有错误,则没法浏览。 html

有什么建议么? linux


#1楼

技巧和窍门

为何要使用编辑器查看 (大)文件? git

在* nix或Cygwin下 ,只需减小使用量便可 。 (有句名言“少便是多,或多或少”,由于“少”代替了之前的Unix命令“更多”,另外还能够向上滚动。)在“少”下搜索和导航相似于Vim,可是没有交换文件和不多的RAM。 github

GNU的Win32端口更少。 请参阅上面答案的“较少”部分。 web

佩尔

Perl适用于快速脚本,它的.. (范围触发器)运算符提供了一种很好的选择机制,以限制您必须经历的工做。 正则表达式

例如: swift

$ perl -n -e 'print if ( 1000000 .. 2000000)' humongo.txt | less

这将提取从1百万行到2百万行的全部内容,并容许您以更少的成本手动筛选输出。 浏览器

另外一个例子: 网络

$ perl -n -e 'print if ( /regex one/ .. /regex two/)' humongo.txt | less

当“正则表达式一”找到某些内容时,此操做开始打印,而当“正则表达式二”找到有趣的块的末尾时,此操做中止。 它可能会找到多个块。 筛选输出...

日志解析器

这是您能够使用的另外一个有用的工具。 引用维基百科的文章

logparser是一种灵活的命令行实用程序,最初由Microsoft员工Gabriele Giuseppini编写,用于自动化IIS日志记录的测试。 它旨在用于Windows操做系统,而且包含在IIS 6.0资源工具包工具中。 logparser的默认行为相似于“数据处理管道”,方法是在命令行上获取SQL表达式,而后输出包含与该SQL表达式匹配的行。

Microsoft将Logparser描述为功能强大的多功能工具,它提供对基于文本的数据(例如日志文件,XML文件和CSV文件)以及Windows操做系统上的关键数据源(例如事件日志,注册表,文件系统和Active Directory。 输入查询的结果能够在基于文本的输出中自定义格式,或者能够持久保存到SQL,SYSLOG或图表等更特殊的目标。

用法示例:

C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line > 1000 and line < 2000"
C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line like '%pattern%'"

尺寸的相对性

100 MB不太大。 3 GB愈来愈大。 我曾经在打印和邮件设施工做,该设施创造了美国一流邮件的2%。 我担任技术负责人的系统之一占邮件总数的15%以上。 咱们处处都有一些大文件要调试。

和更多...

请随时在此处添加更多工具和信息。 这个答案是社区Wiki的一个缘由! 咱们都须要更多有关处理大量数据的建议...


#2楼

VS Code (Windows,macOS,Linux)-具备漂亮GUI的免费和开放源代码。 编辑了一个3.6 GB的JSON文件,只需一分钟便可加载。 您必须有足够的RAM才能加载文件。

免费的只读查看器:

  • glogg (Windows,macOS,Linux)–已确承认处理多GB文件。 它的主要功能是正则表达式搜索。 具备选项卡,能够直接从磁盘读取文件,能够监视/关注文件,并容许用户标记行。
  • LogExpert (Windows)–“ GUI替代tail 。” 支持文件跟踪,搜索,过滤,可配置的突出显示,插件和外部工具。
  • 大文本文件查看器 (Windows)–极简主义,可执行文件很小。 支持拆分视图,文本主题自定义,正则表达式搜索和文件关注。
  • Lister (Windows)–更加小巧和简约。 它是一个可执行文件,只有500 KB,但仍支持搜索(使用正则表达式),打印,十六进制编辑器模式和设置。
  • loxx (Windows)–支持如下,突出显示,行号,大文件,正则表达式,多个文件和视图等等。 免费版本有一些限制。

免费编辑:

  • VimEmacs (Windows,macOS,Linux)–经典Unix编辑器。 学习曲线陡峭,但效率很高。 它们的设置能够调整以使其更快。
  • 大型文件编辑器 (Windows)–打开和编辑TB +文件,支持Unicode,使用不多的内存,具备XML特定的功能,并包括二进制模式。
  • HxD (Windows)–十六进制编辑器,而不是文本编辑器; 可是它很是快并且有用。
  • GigaEdit (Windows)–支持搜索,字符统计和字体自定义。 但这是有问题的–对于大文件,它仅容许覆盖字符,而不能插入字符; 它不将LF视为行终止符,而仅将CRLF视为行终止符。 并且很慢

内置程序(无需安装):

  • less (macOS,Linux)–传统的Unix命令行传呼工具。 使您能够查看几乎任何大小的文本文件。 也能够安装在Windows上。
  • 记事本 (Windows)–较大的文件比较合适,尤为是在自动换行功能关闭的状况下。
  • MORE (Windows)–这是指Windows MORE ,而不是Unix more 。 一个控制台程序,使您能够一次查看一个屏幕的文件。

网络浏览器:

  • htmlpen.com –能够打开和语法突出显示TB +文件。 容许编辑,但很是大的文件除外。 支持搜索,正则表达式和导出。
  • readfileonline.com –另外一个HTML5大文件查看器。 支持搜索。

付费编辑:

  • 010编辑器 (Windows,macOS,Linux)–打开巨大的文件(多达50 GB)。
  • SlickEdit (Windows,macOS,Linux)–打开大文件。
  • UltraEdit (Windows,macOS,Linux)–打开大于6 GB的文件,但必须对其进行更改才能使其实用:菜单»高级»配置»文件处理»临时文件»打开不带临时文件的文件...
  • EmEditor (Windows)–很好地处理很是大的文本文件(官方最多可处理248 GB,但根据一份报告则可处理多达900 GB)。

最后,您是否尝试过使用常规编辑器打开大文件? 一些编辑器实际上能够处理至关大的文件。 特别是, Notepad ++ (Windows)和Sublime Text (Windows,macOS,Linux)支持2 GB范围内的文件。

相关文章
相关标签/搜索