• 當前位置:首頁 > IT技術 > 系統服務 > 正文

    Brat標注工具安裝及使用(虛擬機系統Ubuntu16)
    2022-03-06 18:10:28

    原文地址https://blog.csdn.net/p_jinsan/article/details/96152078

    稍作了一些補充

    1.環境
    windows10->虛擬機->Ubuntu 16.04 64位

    2.前置條件

      2.1更新apt

    sudo apt upgrade
    sudo apt update

      2.2安裝git

    sudo apt install git

      2.3安裝apache2

    sudo apt install apache2

    檢測:瀏覽器中輸入http://127.0.0.1/或者http://localhost/
    進入下圖界面,則說明安裝成功

    ?

      2.4安裝google chrome#個人習慣

    wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
    sudo dpkg -i google-chrome-stable_current_amd64.deb

    3.安裝

      3.1下載brat

    進入主頁下載 http://brat.nlplab.org/index.html

    ?

    補充:點擊Download,像我就出現了無法連接的情況,可以將下載地址復制到迅雷進行下載

    http://weaver.nlplab.org/~brat/releases/brat-v1.3_Crunchy_Frog.tar.gz

    ?

    ?

    ?

      3.2解壓

    tar xzf 路徑/文件名
    eg: tar xzf Downloads/brat-v1.3_Crunchy_Frog.tar.gz

      3.3進入文件夾

    重命名為brat

    cd brat

      3.4安裝,配置一些用戶信息

    ./install.sh

      3.5打開#每次使用都需要

    python2 standalone.py

      3.6打開瀏覽器進入即可開始標注

    http://127.0.0.1:8001/index.xhtml

    4.使用

      4.1登錄后,選中文本后會彈出窗口,選擇實體類型
      4.2拖動標注好的實體可以連接關系
      4.3雙擊標簽可對標簽進行修改或刪除
      4.4點擊data可導出標注好的數據
      ps:未登錄不能進行標注

    ?

    ?

    ?

    ?

    5.配置

    annotation.conf

    1.entities用來定義標注的實體名稱,其格式為每行一個實體類型,
        比如:人名、地名、英雄名、技能名等,可以采用tab來增加二級標注,
        hero
            hero1
    2.relations用來定義實體間的關系,格式為每行定義一種關系,第一列為關系類型,
        隨后是用逗號分隔的ArgNrelations用來定義實體間的關系,格式為每行定義一種關系,第一列為關系類型,
        隨后是用逗號分隔的ArgN:實體名,用來表示關系的各個相關者。
        relation1 Arg1:hero1, Arg2:hero1
    3.events用來定義事件,每行定義一類事件,第一列為事件名,隨后是用逗號分隔的Participant:實體名,
        用來表示事件的各個參與者。
    4.attributes用來定義屬性,每行一個屬性,第一列為屬性名,隨后是用逗號分隔的Arg:<模塊類型>, Value:屬性值,
        注意屬性值可以有多個

    ?

    ?visual.conf#視覺配置文件

    1.采用中文標簽時需要
    2.將annotation.conf中名稱替換
    3.labels
        [labels]
        hero1 | 魏

    ?

    ?6.其他

      6.1中文支持

    添加

    n = re.sub(u'[^a-zA-Zu4e00-u9fa5<>,0-9_-]', '_', n)

    到./server/src/projectconfig.py第163行

    ?

      6.2給.txt文件添加.ann的標引文件

    find 文件夾名稱 -name '*.txt'|sed -e 's|.txt|.ann|g'|xargs touch
    eg:find data/exa -name '*.txt'|sed -e 's|.txt|.ann|g'|xargs touch

    給文件夾內所有.txt文件添加對應的.ann標引文件

    6.3添加用戶(本地不需要)

    直接在config.py文件中添加

    USER_PASSWORD = { 
        'admn': 'admin', 
        'test': 'test', 
        #'user':'password',
        # (add USERNAME:PASSWORD pairs below this line.) 
    }

    7.參考

    中文文本標注工具調研以及BRAT安裝使用

    標注工具Brat安裝(本地)

    本文摘自 :https://www.cnblogs.com/

    開通會員,享受整站包年服務
    国产呦精品一区二区三区网站|久久www免费人咸|精品无码人妻一区二区|久99久热只有精品国产15|中文字幕亚洲无线码