Word Cloud (词云) - JavaScript

时间 2019-11-08

标签 word cloud javascript 栏目 Microsoft Office 繁體版

原文原文链接

在上一篇中已经分享了用 Python 建立词云了。接下来继续总结其余建立词云的方法。javascript

>> Create Word Cloud via JavaScript

JavaScript 能够借助 d3 函数库的 d3-cloud 插件来生成词云。html

1) 下载 d3, d3-cloud 及其相关文件，并在 HTML 文件中引用。java

<script src="dist/d3.v3.min.js"></script>
<script src="dist/d3.layout.cloud.js"></script>
<script src="dist/colorbrewer.v1.min.js"></script>

2) 准备文本。git

咱们再次使用上次保存的 Word Cloud History.txt 的文本。github

3) 用 HTML 写一个简单的 Web Page，让咱们能够作一些简单的交互，例如选择 *.txt 文件，点击生成图形，保存图形等等。canvas

<div role="main">           
    <input type="file" id="txtFile" accept=".txt" single>                  

    <button id="btnCreate">Create</button>
    <button id="btnSave" disabled>Save</button>
          
    <div id="svgBox"></div>
</div>

完成后能够用浏览器打开这个 Web Page 看看。
浏览器

4) 接下来咱们就能够用 JavaScript 去实现这些控件的功能了。和 Python 不一样，JavaScript 不能自动分词和设置停用词，因此咱们须要app

4-a) 读取 *.txt 文件： readTXTFiledom

4-b) 分词：generateWordListsvg

4-c) 重头戏，画 word cloud：drawWordCloud。根据 d3-cloud 给出的API设置字体颜色，字体大小，图形的大小等等。

//Example for Step 3
    var layout = d3.layout.cloud() //构造词云实例
                .size([width, height])
                .words(
                    arrWord.map(function(d) {
                        var index = arrWord.indexOf(d);
                        return {text: d, size: arrWeight[index] * sizeFactor};
                    })
                )
                .padding(5)
                .rotate(function() { return ~~(Math.random() * 2) * 90; })
                .font(fontFamily)
                .fontSize(function(d) { return d.size; })
                .spiral("rectangular")
                .on("end", draw) //全部词语放置完成后运行 draw 函数
                .start();

4-d). 保存图形：saveSVGToPNG

//Save svg as png file
    var svg = document.querySelector("svg");
    var svgData = new XMLSerializer().serializeToString(svg);
    var svgSize = svg.getBoundingClientRect();
    var canvas = document.createElement("canvas");
    canvas.width = svgSize.width;
    canvas.height = svgSize.height;
    var ctx = canvas.getContext("2d");
    var img = document.createElement("img");
    img.setAttribute('crossOrigin', 'anonymous');
    img.setAttribute("src", "data:image/svg+xml;base64," + btoa(svgData));
    img.onload = function() {
        ctx.drawImage(img, 0, 0);
        var imgDataURL = canvas.toDataURL("image/png");
        console.log(canvas.toDataURL("image/png"));
        $("body").append("<a id='hiddenLink' href='" + imgDataURL + "' style='display:none;' download>Download Pic</a>");
        $("#hiddenLink")[0].click();
        $("#hiddenLink").remove();
    };

>> Notes

1) 这个例子尚未实现设置停用词的功能，因此图形中还包括了不少无心义的词语，例如 the, a, of, in 等等。若是你看完这篇博客后有兴趣继续玩玩，能够本身加个 function 实现这个功能。

简单的方法就是设置两个 Object, 一个装词语，一个装停用词。如今词语中读取第一个词，并在停用词中查找。若是是停用词就丢掉，而后读取第二个词，如此类推。

2) 到目前为止，将 svg 保存为其余图片格式（如 *.png）只适用于 Chrome 浏览器和 FireFox 浏览器。曾经花了不少时间去搜索和研究都没有找到在 IE 怎样将 svg 保存成其余图片格式。若是有好心人知道，也和我分享一下吧。Thanks！

>> Sample Code

download here

Word Cloud (词云) - JavaScript

>> Create Word Cloud via JavaScript

>> Notes

>> Sample Code

>> Related Blogs