#91 使用 col 命令删除退格符

2015-09-12

如果通过定向符号输出 man 文档到文件,然后通过 vi 打开会看到很多蓝色的 ^H 符号。
如果是用 catlessmore 等命令查看(输出到屏幕)就不会看到。

#90 SSH 免密码登录工具:sshpass

2015-09-12

1. 下载源码包

https://sourceforge.net/projects/sshpass/

2. 安装

tar -xvf sshpass-1.05.tar.gz
cd sshpass-1.05.tar.gz
./config
make && make install

3. 使用

sshpass -p '111111' ssh 192.168.22.2 -o StrictHostKeyChecking=no -o UserKnownHostsFile=/dev/null

因为首次访问时需要通过 known_keys 检查,一旦未通过就不会继续执行导致后面的命令失败。
最好加上 StrictHostKeyChecking=no 配置。
如果不希望对方的 host key 被记录可以再加上 UserKnownHostsFile=/dev/null。

#87 常用英语单词

2015-08-31

星期

  • mon, monday, 星期一
  • tue, tuesday, 星期二
  • wed, wednesday, 星期三
  • thu, thursday, 星期四
  • fri, friday, 星期五
  • sat, saturday, 星期六
  • sun, sunday, 星期日

月份

  • jan, january, 一月
  • feb, february, 二月
  • mar, march, 三月
  • apr, april, 四月
  • may, may, 五月
  • jun, june, 六月
  • jul, july, 七月
  • aug, august, 八月
  • sep, september, 九月
  • oct, october, 十月
  • nov, november, 十一月
  • dec, december, 十二月

#86 转载:不黄不足以平民愤

2015-08-26

话说公元前720年的古希腊奥运会,人类尚未发明正式短裤(注:人类女式内裤的历史迄今不足300年),运动员上场只好扎一个兜裆布。一位唤作奥耳西波的爷,跑着就跑丢了,人们看见他象腰缠钟摆一样,顿时哄堂大笑。但他却坚持到终点,所有的人皆为之感动并从中发现人体巨大的美——从此,古代奥运会皆统一裸体比赛。
现代奥运会却穿上了裤子,而且最初女游泳运动员还必须穿湿重达30磅的连衣裤参赛——这就是所谓文明进化的重负。
20世纪中下叶,似乎全球许多地区皆开始了一场性觉醒运动。比基尼像原子弹一样诞生,我们终于可以坐在电视机前,一边看女子沙滩排球的前仆后滚,一边看她们悄悄从短裤内抠沙的奇妙风景了――这真是人类自娱自乐的一道声色大餐啊!

#85 Unicode 编码中中文字符的范围

2015-08-25

突然来了兴致,想看看 Unicode 中有多少个中文,查了一下,很多人都是说 4e00 至 9fff 段1

# -*- coding: utf-8 -*-

all_chinese_in_unicode = range(0x4e00, 0x9fff)


def transfer(u_char_num):
    if isinstance(u_char_num, int):
        u_char_hex = '%x' % u_char_num
        u_char_str = '\u' + u_char_hex
    else:
        if isinstance(u_char_num, str) and len(u_char_num) == 4:
            u_char_str = '\u' + u_char_num
        else:
            raise Exception
    u_char = u_char_str.decode('raw_unicode_escape')
    # print u_char_hex, u_char
    return u_char


def test_transfer():
    # repr(u"国") -> u'\u56fd' -> 22269
    print transfer(0x56fd)


# 打印所有中文字符
# for i in all_chinese_in_unicode:
#    print transfer(i),
# print

# 打印最后一个中文字符及前、后各一个字符
last_chinese_char = 0x9fbb
last_chinese_char_index = all_chinese_in_unicode.index(last_chinese_char)
start, end = last_chinese_char_index - 1, last_chinese_char_index + 2
for i in all_chinese_in_unicode[start:end]:
    print transfer(i),
print

Ubuntu 下的 zsh 中运行,只能显示到这个字符:龻,后面的都是乱码,这个字符对应的十六进制数是 9fbb

结果又意外发现,最后一个字符似乎不是 9fbb,而是 9fcc(改 URL 一个一个试出来的)。

来源:https://www.fileformat.info/info/unicode/char/9fcc/index.htm
对应文字图片:https://www.fileformat.info/info/unicode/char/9fcc/sample.png

当然,这个来源并不保证权威,也可能有错误,涉及中文字符的范围还是使用 4e00 - 9fff 比较保险。

比如正则表达式:[\u4e00-\u9fff]

标点符号

看来是需要抽半天空闲时间,仔细研究研究编码问题了。

参考


  1. 51CTO 博客,lover007,正则匹配中文及常用正则表达式 

#84 重新开博声明

2015-08-24

主要是说明一下为什么博客为什么突然中断了,以及现在打算怎么弄。