howtouse.md

文字コードについての注意

wameicheckrでは,基本的に文字コードとしてUTF-8を使用しています. WidowsでShift-JIS(CP932)を使用している場合は,文字化けが起こる可能性があります. その場合は,文字コードの変換をしてください.

  # x <- "Shift-JISの文字列"
  # iconv(x, from="CP932", to="UTF-8")  # Shift-JISからUTF-8への変換

維管束植物和名チェックリストの利用

準備

library(tidyverse)
#> -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
#> v ggplot2 3.3.5     v purrr   0.3.4
#> v tibble  3.1.6     v dplyr   1.0.7
#> v tidyr   1.1.4     v stringr 1.4.0
#> v readr   2.0.2     v forcats 0.5.1
#> -- Conflicts ------------------------------------------ tidyverse_conflicts() --
#> x dplyr::filter() masks stats::filter()
#> x dplyr::lag()    masks stats::lag()
library(wameicheckr)
library(magrittr)
#> 
#> Attaching package: 'magrittr'
#> The following object is masked from 'package:purrr':
#> 
#>     set_names
#> The following object is masked from 'package:tidyr':
#> 
#>     extract
library(stringi)

維管束植物和名チェックリストはパッケージ内にある. 読み込んだあとで,使いやすくするために,若干の整理を実行

data(hub_master)
data(jn_master)
hub_master <- 
  hub_master %>%
  tibble::as_tibble() %>%
  dplyr::rename_with(~stringr::str_replace_all(., "[ /]", "_")) %>%
  dplyr::rename_with(~stringr::str_replace_all(., "[()]", "")) %>%
  print()
#> # A tibble: 30,430 x 12
#>    all_name    Hub_name   lato_stricto Family_ID Family_name Family_name_JP GL   
#>    <chr>       <chr>      <chr>        <chr>     <chr>       <chr>          <chr>
#>  1 アスヒカズ~ アスヒカ~  <NA>         1         Lycopodiac~ ヒカゲノカズラ GL_0~
#>  2 イヌヤチス~ イヌヤチ~  <NA>         1         Lycopodiac~ ヒカゲノカズラ GL_0~
#>  3 イワヒモ    ヒモラン   <NA>         1         Lycopodiac~ ヒカゲノカズラ GL_0~
#>  4 ウチワマン~ マンネン~  <NA>         1         Lycopodiac~ ヒカゲノカズラ GL_0~
#>  5 エゾコスギ~ エゾコス~  <NA>         1         Lycopodiac~ ヒカゲノカズラ <NA> 
#>  6 エゾノコス~ コスギラン 広義         1         Lycopodiac~ ヒカゲノカズラ GL_0~
#>  7 エゾヒカゲ~ ヒカゲノ~  広義         1         Lycopodiac~ ヒカゲノカズラ <NA> 
#>  8 エゾヒカゲ~ エゾヒカ~  <NA>         1         Lycopodiac~ ヒカゲノカズラ GL_0~
#>  9 オオスギカ~ オオスギ~  <NA>         1         Lycopodiac~ ヒカゲノカズラ <NA> 
#> 10 オニトウゲ~ オニトウ~  <NA>         1         Lycopodiac~ ヒカゲノカズラ <NA> 
#> # ... with 30,420 more rows, and 5 more variables: SF <chr>, WF <chr>,
#> #   YL <chr>, status <chr>, message <chr>

jn_master <- 
  jn_master %>%
  tibble::as_tibble() %>%
  dplyr::rename_with(~stringr::str_replace_all(., "[ /]", "_")) %>%
  dplyr::rename_with(~stringr::str_replace_all(., "[()]", "")) %>%
  fill_another_name_id() %>% # another_name_id の空欄を埋める
  print()
#> # A tibble: 53,222 x 11
#>    ID       Family_ID Family_name   Family_name_JP common_name      another_name
#>    <chr>    <chr>     <chr>         <chr>          <chr>            <chr>       
#>  1 GL_00001 1         Lycopodiaceae ヒカゲノカズラ ヒメスギラン     ヒメスギラン
#>  2 GL_00002 1         Lycopodiaceae ヒカゲノカズラ コスギラン       コスギラン  
#>  3 GL_00002 1         Lycopodiaceae ヒカゲノカズラ コスギラン       エゾノコス~ 
#>  4 GL_00002 1         Lycopodiaceae ヒカゲノカズラ コスギラン       チシマスギ~ 
#>  5 GL_00003 1         Lycopodiaceae ヒカゲノカズラ トウゲシバ       トウゲシバ  
#>  6 GL_00003 1         Lycopodiaceae ヒカゲノカズラ トウゲシバ       ホソバトウ~ 
#>  7 GL_00003 1         Lycopodiaceae ヒカゲノカズラ トウゲシバ       ヒロハトウ~ 
#>  8 GL_00003 1         Lycopodiaceae ヒカゲノカズラ トウゲシバ       オニトウゲ~ 
#>  9 GL_00004 1         Lycopodiaceae ヒカゲノカズラ コスギトウゲシバ コスギトウ~ 
#> 10 GL_00005 1         Lycopodiaceae ヒカゲノカズラ イヌヤチスギラン イヌヤチス~ 
#> # ... with 53,212 more rows, and 5 more variables: another_name_ID <dbl>,
#> #   note_1 <chr>, note_2 <chr>, scientific_name_with_author <chr>,
#> #   scientific_name_without_author <chr>

最新版が異なる場合は,ウェブページからダウンロードして使用することも可能.

  # Download wamei chek list form https://www.gbif.jp/v2/activities/wamei_checklist.html
  # Change file name (version)
  # Set your directory by setwd()
library(readxl)

path <- "wamei_checklist_ver.1.10.xlsx"

hub_master <-
  readxl::read_xlsx(path, sheet="Hub_data",   col_types="text") %>%
  dplyr::rename_with(~stringr::str_replace_all(., "[ /]", "_")) %>%
  dplyr::rename_with(~stringr::str_replace_all(., "[()]", ""))

jn_master <- 
  readxl::read_xlsx(path, sheet="JN_dataset", col_types="text") %>% 
  dplyr::rename_with(~stringr::str_replace_all(., "[ /]", "_")) %>%
  dplyr::rename_with(~stringr::str_replace_all(., "[()]", "")) %>%
  fill_another_name_id()  # another_name_id の空欄を埋める

エラーの修正

和名チェックリスト ver.1.10のエラーの修正. バージョンアップで,修正される予定.

  # (和名チェックリスト ver.1.10への対応) another_name_IDに0がないもの
no_id_0 <- 
  c("SF_00131", "SF_00323", "WF_01542", "WF_02219", "WF_04287", 
  "SF_00127","WF_01902","WF_03825","YL_11456","YL_17759")
jn_master$another_name_ID[jn_master$ID %in% no_id_0 & jn_master$another_name_ID != 0] <- 0

  # (和名チェックリスト ver.1.10への対応) シベリアカラマツ(別科同名)
hub_master$Hub_name[
  hub_master$Hub_name=="シベリアカラマツ" &
  hub_master$Family_name_JP=="マツ"] <- 
  "シベリアカラマツ(マツ科)"
hub_master$Hub_name[
  hub_master$Hub_name=="シベリアカラマツ" &
  hub_master$Family_name_JP=="キンポウゲ"] <- 
  "シベリアカラマツ(キンポウゲ科)"
jn_master$Family_name_JP[
  jn_master$Family_name_JP=="ツルボラン"] <- 
  "ワスレグサ"

和名の抽出

x1は,和名チェックリストにある和名をすべて抽出. 多いので,下記では最初の50だけ. x2は,色々なパターンを含む和名.

  # hubやjnの種名を抽出(全種)
x1 <- 
  c(hub_master$all_name, hub_master$Hub_name, jn_master$common_name, jn_master$another_name) %>%
  purrr::map(str_split, "/") %>%
  unlist() %>% unique() %>% sort() %>%
  c("だみーの和名", .)

  # 和名の例
x2 <- c("だみー", "ススキ", "ハリガネワラビ", "オミナエシ", "コナスビ", "カナビキソウ", 
  "ヤイトバナ", "チガヤ", "キジムシロ", "ハエドクソウ", "キツネノマゴ", "シロヨメナ", 
  "オオフジシダ", "コマツナギ", "アイヌタチツボスミレ", "シベリアカラマツ", "アオイモドキ")

和名のチェック(R版)

入力和名に対する和名・学名の候補を出力する. なお,x1は多いので,最初の50だけを使用.

wamei_check(x1[1:50], hub_master, jn_master)
#> # A tibble: 50 x 23
#>    input  n_match hub_plus    status  Family_ID Family_name Family_name_JP WF_ID
#>    <chr>  <chr>   <chr>       <chr>   <chr>     <chr>       <chr>          <chr>
#>  1 だみ~  0       該当なし    該当な~ -         -           -              -    
#>  2 mulbe~ 1       マグワ      確定    213       Moraceae    クワ           WF_0~
#>  3 no na~ 0       該当なし    該当な~ -         -           -              -    
#>  4 no_na~ 1       no_named_G~ 確定    101       Potamogeto~ ヒルムシロ     -    
#>  5 no_na~ 1       ムカゴサイ~ 確定    124       Orchidaceae ラン           WF_0~
#>  6 no_na~ 1       ミチノクサ~ 確定    206       Rosaceae    バラ           WF_0~
#>  7 no_na~ 1       ヤエガワカ~ 確定    221       Betulaceae  カバノキ       -    
#>  8 no_na~ 1       no_named_G~ 確定    221       Betulaceae  カバノキ       -    
#>  9 no_na~ 1       no_named_G~ 確定    416       Gentianace~ リンドウ       -    
#> 10 no_na~ 1       no_named_G~ 確定    466       Asteraceae  キク           -    
#> # ... with 40 more rows, and 15 more variables: YL_ID <chr>, GL_ID <chr>,
#> #   SF_ID <chr>, WF_common_name <chr>, YL_common_name <chr>,
#> #   GL_common_name <chr>, SF_common_name <chr>,
#> #   WF_scientific_name_with_author <chr>, YL_scientific_name_with_author <chr>,
#> #   GL_scientific_name_with_author <chr>, SF_scientific_name_with_author <chr>,
#> #   WF_scientific_name_without_author <chr>,
#> #   YL_scientific_name_without_author <chr>, ...
wamei_check(x1[1:50], hub_master, jn_master, wide=FALSE)
#> # A tibble: 111 x 12
#>    input         n_match hub_plus     status  source ID    Family_ID Family_name
#>    <chr>         <chr>   <chr>        <chr>   <chr>  <chr> <chr>     <chr>      
#>  1 だみーの和名  0       該当なし     該当な~ -      -     -         -          
#>  2 mulberry      1       マグワ       確定    WF     WF_0~ 213       Moraceae   
#>  3 mulberry      1       マグワ       確定    YL     YL_0~ 213       Moraceae   
#>  4 no named      0       該当なし     該当な~ -      -     -         -          
#>  5 no_named_GL01 1       no_named_GL~ 確定    GL     GL_0~ 101       Potamogeto~
#>  6 no_named_GL02 1       ムカゴサイ~  確定    GL     GL_0~ 124       Orchidaceae
#>  7 no_named_GL02 1       ムカゴサイ~  確定    WF     WF_0~ 124       Orchidaceae
#>  8 no_named_GL02 1       ムカゴサイ~  確定    YL     YL_0~ 124       Orchidaceae
#>  9 no_named_GL03 1       ミチノクサ~  確定    GL     GL_0~ 206       Rosaceae   
#> 10 no_named_GL03 1       ミチノクサ~  確定    WF     WF_0~ 206       Rosaceae   
#> # ... with 101 more rows, and 4 more variables: Family_name_JP <chr>,
#> #   common_name <chr>, scientific_name_with_author <chr>,
#> #   scientific_name_without_author <chr>
wamei_check(x2,       hub_master, jn_master,             ds=c(GL, SF, WF))
#> # A tibble: 17 x 19
#>    input   n_match hub_plus    status Family_ID Family_name Family_name_JP WF_ID
#>    <chr>   <chr>   <chr>       <chr>  <chr>     <chr>       <chr>          <chr>
#>  1 だみー  0       該当なし    該当~  -         -           -              -    
#>  2 ススキ  1       ススキ      確定   166       Poaceae     イネ           WF_0~
#>  3 ハリガ~ 1       ハリガネワ~ 確定   42        Thelypteri~ ヒメシダ       -    
#>  4 オミナ~ 1       オミナエシ  確定   472       Caprifolia~ スイカズラ     WF_0~
#>  5 コナス~ 1       コナスビ狭~ 確定   398       Primulaceae サクラソウ     WF_0~
#>  6 カナビ~ 1       カナビキソ~ 確定   339       Santalaceae ビャクダン     WF_0~
#>  7 ヤイト~ 1       ヘクソカズ~ 確定   415       Rubiaceae   アカネ         WF_0~
#>  8 チガヤ  1       チガヤ狭義  確定   166       Poaceae     イネ           WF_0~
#>  9 キジム~ 2       キジムシロ~ 確定   206       Rosaceae    バラ           WF_0~
#> 10 ハエド~ 2       ハエドクソ~ !未~  448       Phrymaceae  ハエドクソウ   WF_0~
#> 11 キツネ~ 1       キツネノマ~ !未~  440       Acanthaceae キツネノマゴ   WF_0~
#> 12 シロヨ~ 2       シロヨメナ~ !未~  466       Asteraceae  キク           WF_0~
#> 13 オオフ~ 2       オオフジシ~ !未~  31        Dennstaedt~ コバノイシカ~  -    
#> 14 コマツ~ 2       コマツナギ~ !未~  203       Fabaceae    マメ           WF_0~
#> 15 アイヌ~ 2       アイヌタチ~ 確定   263       Violaceae   スミレ         WF_0~
#> 16 シベリ~ 1       シベリアカ~ 確定   174       Ranunculac~ キンポウゲ     WF_0~
#> 17 アオイ~ 1       エノキアオ~ 確定   310       Malvaceae   アオイ         WF_0~
#> # ... with 11 more variables: GL_ID <chr>, SF_ID <chr>, WF_common_name <chr>,
#> #   GL_common_name <chr>, SF_common_name <chr>,
#> #   WF_scientific_name_with_author <chr>, GL_scientific_name_with_author <chr>,
#> #   SF_scientific_name_with_author <chr>,
#> #   WF_scientific_name_without_author <chr>,
#> #   GL_scientific_name_without_author <chr>,
#> #   SF_scientific_name_without_author <chr>
wamei_check(x2,       hub_master, jn_master, wide=FALSE, ds=c(GL, SF, WF))
#> # A tibble: 32 x 12
#>    input          n_match hub_plus   status  source ID    Family_ID Family_name 
#>    <chr>          <chr>   <chr>      <chr>   <chr>  <chr> <chr>     <chr>       
#>  1 だみー         0       該当なし   該当な~ -      -     -         -           
#>  2 ススキ         1       ススキ     確定    GL     GL_0~ 166       Poaceae     
#>  3 ススキ         1       ススキ     確定    WF     WF_0~ 166       Poaceae     
#>  4 ハリガネワラビ 1       ハリガネ~  確定    GL     GL_0~ 42        Thelypterid~
#>  5 ハリガネワラビ 1       ハリガネ~  確定    SF     SF_0~ 42        Thelypterid~
#>  6 オミナエシ     1       オミナエシ 確定    GL     GL_0~ 472       Caprifoliac~
#>  7 オミナエシ     1       オミナエシ 確定    WF     WF_0~ 472       Caprifoliac~
#>  8 コナスビ       1       コナスビ~  確定    GL     GL_0~ 398       Primulaceae 
#>  9 コナスビ       1       コナスビ~  確定    WF     WF_0~ 398       Primulaceae 
#> 10 カナビキソウ   1       カナビキ~  確定    GL     GL_0~ 339       Santalaceae 
#> # ... with 22 more rows, and 4 more variables: Family_name_JP <chr>,
#> #   common_name <chr>, scientific_name_with_author <chr>,
#> #   scientific_name_without_author <chr>

和名のチェック(エクセル版)

エクセルと同等の出力の場合.

wamei_check_ex(x1[1:50], hub_master, jn_master, wide=FALSE)
#> # A tibble: 111 x 12
#>    input         n_match Hub_name    status  source ID     Family_ID Family_name
#>    <chr>           <dbl> <chr>       <chr>   <chr>  <chr>  <chr>     <chr>      
#>  1 だみーの和名        0 !候補なし  !個別~ <NA>   <NA>   <NA>      <NA>       
#>  2 mulberry            1 マグワ      確定    WF     WF_03~ 213       Moraceae   
#>  3 mulberry            1 マグワ      確定    YL     YL_09~ 213       Moraceae   
#>  4 no named            0 !候補なし  !個別~ <NA>   <NA>   <NA>      <NA>       
#>  5 no_named_GL01       1 no_named_G~ 確定    GL     GL_01~ 101       Potamogeto~
#>  6 no_named_GL02       1 ムカゴサイ~ 確定    GL     GL_02~ 124       Orchidaceae
#>  7 no_named_GL02       1 ムカゴサイ~ 確定    WF     WF_00~ 124       Orchidaceae
#>  8 no_named_GL02       1 ムカゴサイ~ 確定    YL     YL_03~ 124       Orchidaceae
#>  9 no_named_GL03       1 ミチノクサ~ 確定    GL     GL_04~ 206       Rosaceae   
#> 10 no_named_GL03       1 ミチノクサ~ 確定    WF     WF_03~ 206       Rosaceae   
#> # ... with 101 more rows, and 4 more variables: Family_name_JP <chr>,
#> #   common_name <chr>, scientific_name_with_author <chr>,
#> #   scientific_name_without_author <chr>
wamei_check_ex(x2,       hub_master, jn_master)
#> # A tibble: 17 x 23
#>    input   n_match Hub_name    status Family_ID Family_name Family_name_JP GL_ID
#>    <chr>     <dbl> <chr>       <chr>  <chr>     <chr>       <chr>          <chr>
#>  1 だみー        0 !候補なし  !個~  <NA>      <NA>        <NA>           <NA> 
#>  2 ススキ        1 ススキ      確定   166       Poaceae     イネ           GL_0~
#>  3 ハリガ~       1 ハリガネワ~ 確定   42        Thelypteri~ ヒメシダ       GL_0~
#>  4 オミナ~       1 オミナエシ  確定   472       Caprifolia~ スイカズラ     GL_0~
#>  5 コナス~       2 コナスビ広~ !個~  <NA>      <NA>        <NA>           <NA> 
#>  6 カナビ~       1 カナビキソ~ 確定   339       Santalaceae ビャクダン     GL_0~
#>  7 ヤイト~       1 ヘクソカズ~ 確定   415       Rubiaceae   アカネ         GL_0~
#>  8 チガヤ        2 チガヤ広義~ !個~  <NA>      <NA>        <NA>           <NA> 
#>  9 キジム~       2 キジムシロ~ !個~  <NA>      <NA>        <NA>           <NA> 
#> 10 ハエド~       3 要検討(ハ~ !個~  <NA>      <NA>        <NA>           <NA> 
#> 11 キツネ~       2 キツネノマ~ !個~  <NA>      <NA>        <NA>           <NA> 
#> 12 シロヨ~       2 要検討(シ~ !個~  <NA>      <NA>        <NA>           <NA> 
#> 13 オオフ~       2 要検討(ア~ !個~  <NA>      <NA>        <NA>           <NA> 
#> 14 コマツ~       2 要検討(コ~ !個~  <NA>      <NA>        <NA>           <NA> 
#> 15 アイヌ~       2 アイヌタチ~ !個~  <NA>      <NA>        <NA>           <NA> 
#> 16 シベリ~       2 シベリアカ~ !個~  <NA>      <NA>        <NA>           <NA> 
#> 17 アオイ~       2 アオイゴケ~ !個~  <NA>      <NA>        <NA>           <NA> 
#> # ... with 15 more variables: WF_ID <chr>, YL_ID <chr>, SF_ID <chr>,
#> #   GL_common_name <chr>, WF_common_name <chr>, YL_common_name <chr>,
#> #   SF_common_name <chr>, GL_scientific_name_with_author <chr>,
#> #   WF_scientific_name_with_author <chr>, YL_scientific_name_with_author <chr>,
#> #   SF_scientific_name_with_author <chr>,
#> #   GL_scientific_name_without_author <chr>,
#> #   WF_scientific_name_without_author <chr>, ...

和名のチェック(関数不使用)

合致する全ての和名・学名等を出力する場合は,wameicheckrの関数を使わなくても可能.

hub_long <- 
  hub_master %>%
  tidyr::pivot_longer(cols= GL:YL, names_to = "source", values_to = "ID", values_drop_na = TRUE)
tibble::tibble(input = x2) %>%
  left_join(hub_long, by=c("input"="all_name")) %>%
  left_join(jn_master)
#> Joining, by = c("Family_ID", "Family_name", "Family_name_JP", "ID")
#> # A tibble: 98 x 17
#>    input     Hub_name   lato_stricto Family_ID Family_name  Family_name_JP status
#>    <chr>     <chr>      <chr>        <chr>     <chr>        <chr>          <chr> 
#>  1 だみー    <NA>       <NA>         <NA>      <NA>         <NA>           <NA>  
#>  2 ススキ    ススキ     <NA>         166       Poaceae      イネ           確定  
#>  3 ススキ    ススキ     <NA>         166       Poaceae      イネ           確定  
#>  4 ススキ    ススキ     <NA>         166       Poaceae      イネ           確定  
#>  5 ハリガネ~ ハリガネ~  <NA>         42        Thelypterid~ ヒメシダ       確定  
#>  6 ハリガネ~ ハリガネ~  <NA>         42        Thelypterid~ ヒメシダ       確定  
#>  7 ハリガネ~ ハリガネ~  <NA>         42        Thelypterid~ ヒメシダ       確定  
#>  8 オミナエ~ オミナエシ <NA>         472       Caprifoliac~ スイカズラ     確定  
#>  9 オミナエ~ オミナエシ <NA>         472       Caprifoliac~ スイカズラ     確定  
#> 10 オミナエ~ オミナエシ <NA>         472       Caprifoliac~ スイカズラ     確定  
#> # ... with 88 more rows, and 10 more variables: message <chr>, source <chr>,
#> #   ID <chr>, common_name <chr>, another_name <chr>, another_name_ID <dbl>,
#> #   note_1 <chr>, note_2 <chr>, scientific_name_with_author <chr>,
#> #   scientific_name_without_author <chr>

類似した和名・学名の検索(入力間違い時の推定)

編集距離を利用して類似した和名や学名を検索可能である. 参照用の和名と学名は,jn_masterから抽出したものを利用している.

data(ref_jp)  # 和名の参照用データ
ref_jp        # 和名は文字コードの関係でエスケープ文字を使用
#> # A tibble: 51,809 x 2
#>    source name_jp                                                   
#>    <chr>  <chr>                                                     
#>  1 GL     "\\u30d2\\u30e1\\u30b9\\u30ae\\u30e9\\u30f3"              
#>  2 GL     "\\u30b3\\u30b9\\u30ae\\u30e9\\u30f3"                     
#>  3 GL     "\\u30a8\\u30be\\u30ce\\u30b3\\u30b9\\u30ae\\u30e9\\u30f3"
#>  4 GL     "\\u30c1\\u30b7\\u30de\\u30b9\\u30ae\\u30e9\\u30f3"       
#>  5 GL     "\\u30c8\\u30a6\\u30b2\\u30b7\\u30d0"                     
#>  6 GL     "\\u30db\\u30bd\\u30d0\\u30c8\\u30a6\\u30b2\\u30b7\\u30d0"
#>  7 GL     "\\u30d2\\u30ed\\u30cf\\u30c8\\u30a6\\u30b2\\u30b7\\u30d0"
#>  8 GL     "\\u30aa\\u30cb\\u30c8\\u30a6\\u30b2\\u30b7\\u30d0"       
#>  9 GL     "\\u30b3\\u30b9\\u30ae\\u30c8\\u30a6\\u30b2\\u30b7\\u30d0"
#> 10 GL     "\\u30a4\\u30cc\\u30e4\\u30c1\\u30b9\\u30ae\\u30e9\\u30f3"
#> # ... with 51,799 more rows
ref_jp %>%    # stri_unescape_unicode()で通常の文字に戻る
  dplyr::mutate(name_jp=stringi::stri_unescape_unicode(name_jp))
#> # A tibble: 51,809 x 2
#>    source name_jp         
#>    <chr>  <chr>           
#>  1 GL     ヒメスギラン    
#>  2 GL     コスギラン      
#>  3 GL     エゾノコスギラン
#>  4 GL     チシマスギラン  
#>  5 GL     トウゲシバ      
#>  6 GL     ホソバトウゲシバ
#>  7 GL     ヒロハトウゲシバ
#>  8 GL     オニトウゲシバ  
#>  9 GL     コスギトウゲシバ
#> 10 GL     イヌヤチスギラン
#> # ... with 51,799 more rows

data(ref_sc)  # 学名の参照用データ
ref_sc
#> # A tibble: 76,379 x 2
#>    source name_sc                                              
#>    <chr>  <chr>                                                
#>  1 GL     Huperzia miyoshiana (Makino) Ching                   
#>  2 GL     Huperzia miyoshiana                                  
#>  3 GL     Huperzia selago (L.) Bernh. ex Schrank et C.F.P.Mart.
#>  4 GL     Huperzia selago                                      
#>  5 GL     Huperzia serrata (Thunb.) Trevis.                    
#>  6 GL     Huperzia serrata                                     
#>  7 GL     Huperzia somae (Hayata) Ching                        
#>  8 GL     Huperzia somae                                       
#>  9 GL     Lycopodiella caroliniana (L.) Pic.Serm.              
#> 10 GL     Lycopodiella caroliniana                             
#> # ... with 76,369 more rows

  # 1つだけ検索
  # 和名: search_similar_name() では len=6 が必須(文字コードの関係)
search_similar_name("ハッカグサ", len=6)
#> # A tibble: 585 x 5
#>    input      maybe   dist dist_norm source    
#>    <chr>      <chr>  <int>     <dbl> <chr>     
#>  1 ハッカグサ スギナ     3       0.6 GL; SF; YL
#>  2 ハッカグサ トクサ     3       0.6 GL; SF; YL
#>  3 ハッカグサ コシダ     3       0.6 GL; SF; YL
#>  4 ハッカグサ メヘゴ     3       0.6 GL; SF; YL
#>  5 ハッカグサ ヘゴ       2       0.4 GL; SF; YL
#>  6 ハッカグサ ワラビ     3       0.6 GL; SF; YL
#>  7 ハッカグサ ホシダ     3       0.6 GL; SF; YL
#>  8 ハッカグサ オシダ     3       0.6 GL; SF; YL
#>  9 ハッカグサ メンマ     3       0.6 GL; SF; YL
#> 10 ハッカグサ イノデ     3       0.6 GL; SF; YL
#> # ... with 575 more rows
  # 学名
search_similar_name("Viola madahuricaa", len=1)
#> # A tibble: 1 x 5
#>   input             maybe              dist dist_norm source
#>   <chr>             <chr>             <int>     <dbl> <chr> 
#> 1 Viola madahuricaa Viola mandshurica     3     0.176 YL

  # 複数を検索
  # 和名
mosiya(c("ハッカグサ", "スズノエンドウ"))
#> # A tibble: 10 x 5
#>    input          maybe             dist dist_norm source    
#>    <chr>          <chr>            <int>     <dbl> <chr>     
#>  1 ハッカグサ     ハダカグリ           2     0.4   GL; YL    
#>  2 ハッカグサ     ハシカグサ           1     0.2   GL; WF; YL
#>  3 ハッカグサ     ハッカ               2     0.4   GL; WF; YL
#>  4 ハッカグサ     ハハコグサ           2     0.4   GL; WF; YL
#>  5 ハッカグサ     コヌカグサ           2     0.4   WF; YL    
#>  6 ハッカグサ     ラッパグサ           2     0.4   YL        
#>  7 スズノエンドウ スズメノエンドウ     1     0.125 GL; WF; YL
#>  8 スズノエンドウ スギナエンドウ       2     0.286 YL        
#>  9 スズノエンドウ ノエンドウ           2     0.286 YL        
#> 10 スズノエンドウ タチノエンドウ       2     0.286 YL
  # 検索条件の変更が可能
  # min_dist: 編集距離
  # min_dist_norm: 標準化した編集距離
mosiya(c("ハッカグサ", "スズノエンドウ"), min_dist=2, min_dist_norm=0.1)
#> # A tibble: 2 x 5
#>   input          maybe             dist dist_norm source    
#>   <chr>          <chr>            <int>     <dbl> <chr>     
#> 1 ハッカグサ     ハシカグサ           1     0.2   GL; WF; YL
#> 2 スズノエンドウ スズメノエンドウ     1     0.125 GL; WF; YL
  # 学名
maybe(c("Viola madahuricaa", "Carex nevarta"))
#> # A tibble: 2 x 5
#>   input             maybe              dist dist_norm source    
#>   <chr>             <chr>             <int>     <dbl> <chr>     
#> 1 Viola madahuricaa Viola mandshurica     3     0.176 YL        
#> 2 Carex nevarta     Carex nervata         2     0.154 GL; WF; YL


matutosi/wameicheckr documentation built on Aug. 14, 2024, 4:39 p.m.