XeLaTeX覚書:多言語環境で部分的に日本語を使おう!

多言語環境でTeXを使える、XeTeXというものがあります。
XeTeX - Wikipedia

下の写真を見てもらえばわかると思うのですが、多言語環境を一つのPDFで実現できる中々のスグレモノです。
f:id:jagging:20140514210739p:plain

今回、僕の目的はギリシャ語・日本語混じり文をTeXで生成することなので、『部分的に』日本語であればOKです。

upLaTeXとかいうpTeXの進化系を使ってもギリシャ語TeXは出来るらしいのですが、設定がゴチャゴチャしていて面倒そうだったので、
(少なくともUbuntu上では)設定のスッキリしているXeLaTeXを用いることにしました。

XeTeX - Wikipedia
Wikipedia上にあるサンプルコードを回してみます(↓)

\documentclass[11pt]{article}
\usepackage{fontspec}
\setmainfont[Ligatures=TeX]{Linux Libertine O}
\begin{document}
\section{Unicode support}
 
\subsection{English}
All human beings are born free and equal in dignity and rights.
 
\subsection{Íslenska}
Hver maður er borinn frjáls og jafn öðrum að virðingu og réttindum.
 
\subsection{Русский}  
Все люди рождаются свободными и равными в своем достоинстве и 
правах.
 
\subsection{Tiếng Việt}
Tất cả mọi người sinh ra đều được tự do và bình đẳng về nhân phẩm và 
quyền lợi.
 
\subsection{Ελληνικά} 
Ὅλοι οἱ ἄνθρωποι γεννιοῦνται ἐλεύθεροι καὶ ἴσοι στὴν ἀξιοπρέπεια 
καὶ τὰ δικαιώματα.
 
\section{Legacy syntax}
When he goes---``Hello World!''\\
She replies—“Hello dear!”
 
\section{Ligatures}
\fontspec[Ligatures={Common, Historical}]{Linux Libertine O Italic}
Questo è strano assai!

\section{Numerals}
\fontspec[Numbers={OldStyle}]{Linux Libertine O}Old style: 1234567\\
\fontspec[Numbers={Lining}]{Linux Libertine O}Lining: 1234567
 
\end{document}

"Linux Libertine O"というフォントが必要そうだったので、
Ubuntu – Package Search Results -- linux-libertine
から必要なフォントを確認し、インストール

 $ sudo apt-get install fonts-linuxlibertine

XeLaTeXを走らせると、一気にpdfファイルまで作ってくれます。

 $ xelatex hoge.tex
 $ evince hoge.pdf

f:id:jagging:20140514204829p:plain

出来てます。


では、今度は日本語の項目も追加してXeLaTeXを走らせてみます。
f:id:jagging:20140514204550p:plain
日本語部分が文字化け、表示されません。。。

今回は部分的に日本語が使えればOKなので、\newfontfamilyで日本語フォント(Ubuntuに入ってたもの)を定義してやります。
もっと簡単に出来るらしい(追記参考)

...
\usepackage{fontspec} \setmainfont[Ligatures=TeX]{Linux Libertine O}
\newfontfamily\ja{IPAPMincho} % ここに一行追加した
\begin{document}
...
% 使うときは {\ja 〜文章〜 }のようにして使う
{\ja
ああああ
        \section{{\ja 日本語}}
すべての人類は尊厳と権利において、生まれながらにして平等かつ自由である。
}
...

f:id:jagging:20140514205555p:plain


これで日本語が部分的に使えるようになりました。

追記

どうやらXeLaTeX で日本語を使うなら、zxjatype.sty
ZXjatype パッケージ ~XeLaTeX でまともな日本語組版を~ [電脳世界の奥底にて]
を使うと良いらしい。

早速試したところ、プリアンプルに

\usepackage{zxjatype}
\setjamainfont{IPA明朝}

を加えるだけで日本語が自由に使えるようになった。

出身大学別年収ランキング(非医)

就活シーズンなので年収という単語、気になります。

出身大学別の年収データが
全300校 出身大学別年収データ | 20代の”はたらき”データベース『キャリアコンパス』- powered by DODA -
で見つかったため、興味本位にパースして
Dropbox - daigaku-gyokai
にアップロードしました。

結果概要

20代年収ベスト10

東京工業大学 20代 560 2000
明治薬科大学 20代 514 620
東京大学 20代 507 1500
一橋大学 20代 484 1000
京都大学 20代 479 1200
東京薬科大学 20代 460 670
慶應義塾大学 20代 458 2500
名古屋大学 20代 448 1300
京都薬科大学 20代 445 550
北陸先端科学技術大学院大学 20代 423 650

20代年収ワースト10

関東学園大学 20代 293 400
女子美術大学 20代 292 500
甲南女子大学 20代 289 600
跡見学園女子大学 20代 288 840
金城学院大学 20代 284 600
天理大学 20代 281 450
名古屋経済大学 20代 280 400
長野大学 20代 280 300
京都造形芸術大学 20代 279 550
東京芸術大学 20代 238 320

番外編


20代年収でソート(2つ目の値は最高値)
Dropbox - sorted_20.txt


30代年収ベスト10

京都薬科大学 30代 760 960
東京大学 30代 707 3000
一橋大学 30代 701 1600
東京薬科大学 30代 685 1450
明治薬科大学 30代 653 1000
慶應義塾大学 30代 650 3500
東京工業大学 30代 648 1500
京都大学 30代 631 2000
大阪大学 30代 602 2000
神戸大学 30代 592 6987

30代年収ワースト10

女子美術大学 30代 367 700
京都精華大学 30代 365 800
東京家政大学 30代 359 618
京都女子大学 30代 357 670
熊本県立大学 30代 356 760
金城学院大学 30代 351 650
甲南女子大学 30代 346 750
大手前大学 30代 345 750
東京芸術大学 30代 337 536
尚美学園大学 30代 310 450

30代年収でソート(2つ目の値は最高値)
Dropbox - sorted_30.txt


40代年収ベスト10

京都薬科大学 40代 1013 1900
一橋大学 40代 950 4500
京都大学 40代 932 3000
東京大学 40代 894 2500
東京薬科大学 40代 888 1400
東北大学 40代 884 3700
明治薬科大学 40代 847 1430
大阪大学 40代 844 5000
防衛大学校 40代 837 1200
大阪薬科大学 40代 827 1200

40代年収ワースト10

京都精華大学 40代 438 720
京都造形芸術大学 40代 434 750
同志社女子大学 40代 429 900
女子美術大学 40代 421 730
聖心女子大学 40代 402 700
文化学園大学(旧:文化女子大学) 40代 384 500
大谷大学 40代 382 600
江戸川大学 40代 360 360
大手前大学 40代 341 400
京都女子大学 40代 340 450


40代年収でソート(2つ目の値は最高値)
Dropbox - sorted_40.txt

考察

20代においては理系よりの名門校と薬科大のスコアが目立ちます。全ての年代において、明治薬科大学京都薬科大学がトップ層に食い込んできているのは象徴的です。

逆に特異なのがワーストの方で、女子大および美大が並んでいるのがわかると思います。
東京芸術大学が最下位になったのは正直驚きました。

単科大に近い大学の方が、ベストにもワーストにも入りやすいように見えます。
年収という視点で見ると学科選びは大きいものではないかなと言うふうに思えました。

やり方

今回はシェルスクリプトでサクッとパース出来ました。
基本的にcat grep sed awkのみでやってます。

cat 全300校\ 出身大学別年収データ\ \ \ 20代の”はたらき”データベース『キャリアコンパス』-\ powered\ by\ DODA\ -.html \
| grep type_old | sed 's/ class=\"bg_tr\"//' \ 
| sed 's/[<>]/ /g' | awk '{print $4,$7,$10}' \
| tr -d "\n" | sed 's/全体/\n全体/g' \
| sed 's/万円/ /g' > nenshu ```

Twitterアカウントの画像を一括ダウンロード出来るシェルスクリプト(twi_image_loader)書いた

最近Twitterを使っていると、アカウントをたどって同じ人の投稿した画像を収集することが多い。

そういうわけで、Twitterアカウント名を入れたらサクサク画像を落としてくれるシェルスクリプトを作った。

使い方:

./twi_image_loader.sh accountname

jamejammy/twi_image_loader · GitHub

ダウンロードしてるとすぐ規制されるのでちまちま使うと便利そう。
f:id:jagging:20140106231909p:plain


コア部分は以下の一行スクリプト

Dynamical Systems in javascript - 最近いじってるもの -

最近jsdo.it - Share JavaScript, HTML5 and CSSがおもしろい。




奇怪な模様が作れたり……





CSSでアニメーションを動かしたりできる。




触発されたので、自分も以下のようなものを実装してみた。




↓参考
ローレンツ方程式 - Wikipedia




↓参考
セル・オートマトン - Wikipedia




javascript.....

楽しい!!(。╹ω╹。)

はてなブログでTeXを使えるように設定した

\[ \frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{\infty} \exp \left\{-\frac{(x-\mu)^2}{2\sigma^2}\right\} \]
\[ ab \]
\begin{eqnarray*}
\cos{x} + i \sin{x}& = &\left(\cos{\frac{x}{n}} + i \sin{\frac{x}{n}}\right)^n \\
& \rightarrow &\left(1 + i\frac{x}{n}\right)^n = \exp{ix}
\end{eqnarray*}


http://ksmakoto.hatenadiary.com/entry/2012/05/14/123441
http://joker.hatenablog.com/entry/2013/05/20/184646

ここらへん見てMathJax設定した。
綺麗にできて嬉しい。

GMailChrome Web Store - GmailTeX
使えばTeX書いて数式画像そのまま送れるし、すっげ。

きんモザアリス表示するだけのChrome拡張つくった

screenshot

id:moga_shi

きんいろモザイクのアリス可愛い!

きんモザapi

可愛い!

すごい!

楽しい!✌('ω'✌)三✌('ω')✌三(✌'ω')✌

気がついたら、きんモザアリス表示するだけのChrome拡張を作ってた。

f:id:jagging:20130928153614g:plain

公開できるようであったので公開した。
https://chrome.google.com/webstore/detail/kinmoza-alice/omhjcielifdcammoheoahpfiabmjiije/related?hl=ja&gl=JP

初めてChrome拡張弄ったのだけれど簡単に出来てすごいなーと。
あとGifzoめちょ便利。

APIっぽいの欲しい

jsとcanvasで画像合成とかしてるから要らない画面が入ってしまう。

現時点で↓こんな風にURLに直書きする感じには出来た。
http://mangahub.me/gen?text=もう寝よう?&size=70px

↓しかし画像としては引用できない
screenshot
canvas使わずにブログで引用とかそのまましたいし、RMagickとかでやるべきなのか。