Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ちゅらデータ会社紹介資料 / ChuraDATA Introduction

amacbee
August 18, 2021

ちゅらデータ会社紹介資料 / ChuraDATA Introduction

ちゅらデータ株式会社の会社紹介資料です。(2022年11月15日更新)
ちょっとでも気になるという方がいらっしゃいましたら、ぜひお気軽にお声がけ下さい!
外部向けに、他社様とコラボした勉強会「ちゅらコラボ #chura_collabo」を月1ペースで開催していたりもするので、そちらもぜひのぞいてみて下さい。

ちゅらデータ求人情報:
https://en-gage.net/churadata/

ちゅらデータ外部イベント情報:
https://churadata.connpass.com/

ちゅらデータ公式YouTubeチャンネル:
https://www.youtube.com/channel/UCNow6pyi8UmbdTbZ7ouZEMQ

amacbee

August 18, 2021
Tweet

More Decks by amacbee

Other Decks in Business

Transcript

  1. ⽬次 会社について P3 事業について P6 事例紹介 P8 プロダクト紹介 P18 組織について

    P21 働き⽅・カルチャー P25 We are hiring P32 © 2022 Chura DATA Inc.
  2. 会社概要 4 景⾊がきれいな オフィスが⾃慢です 社名 ちゅらデータ株式会社 代表者 真嘉⽐ 愛 設⽴

    2017年8⽉7⽇ 住所 〒901-2227 沖縄県宜野湾市 字 宇地泊 558番地18 宜野湾ベイサイド情報センター 5F © 2022 Chura DATA Inc.
  3. 決算・社員数の推移 (2022年6⽉現在) 5 2018年度 2019年度 2020年度 2021年度 純利益 2,776万円 3,800万円

    8,800万円 1億348万円 利益剰余⾦ 2,776万円 6,577万円 1億5,300万円 2億1,800万円 総資産 - 1億348万円 2億7,900万円 3億7,200万円 社員数の推移 29名 30名 48名 22名 決算の推移 官報にて決算情報を公開しております。 創業期から⽐較すると⽉の売上は 約10倍近くまで成⻑しております。 © 2022 Chura DATA Inc.
  4. 事業領域 7 AIモデル構築 業務プロセス改⾰コンサルティング マーケティングコンサルティング AI活⽤アドバイザリー データ分析⽀援 PoC (実証実験) AIモデル組み込み

    データ分析 基盤構築 システム保守 分析研修 分析BPO 企画⽴案・コンサルティング〜AIモデル構築〜システム開発〜運⽤保守まで。 企業のデータに関するあらゆる課題にワンストップで対応できるようサービス領域を拡⼤させています。 © 2022 Chura DATA Inc. AIモデル開発 システム開発 運⽤・改善・AI定着化 分析・施策⽴案 企画・構想⽴案 ワンストップ対応
  5. データ分析事例 9 映像データを⽤いたリアルタイム物体検出 ⽬的 特徴 膨⼤な映像データから特定の物体をリアルタイムに検出・トラッキン グしたい SSD(Single Shot MultiBox

    Detector)を⽤いた物体検 出アルゴリズムと、物体トラッキングアルゴリズムを独⾃ロジックで複 合させたモデルを構築した イメージ 効果 フレームアウトや物体の⼀部が隠れてしまったケースについても、⾼ 精度に検出する仕組みを実現した 時刻: ◦時◦分◦秒、ID: 1、物体: 冷蔵庫 (99.7%) 時刻: ◦時◦分◦秒、ID: 2、物体: 本棚 (84.3%) 1 2 3 4 1 3 4 製造⼯程における不良品検知 ⽬的 特徴 製造⼯程において⼊⼿出来るデータから製品の品質を予測し、不 良品を予め特定したい Convolutional Neural Network(CNN)を⽤いた不良品 分類モデルを構築し、不良品予測を実施した イメージ 効果 ⾼精度に不良品を特定できるモデルを構築した 不良の有無を 特定 学習状況評価 様々な軸から モデルを評価し精度 変動要因 を特定 着⽬点評価 © 2022 Chura DATA Inc.
  6. データ分析事例 10 ⽂章校正業務の省⼒化 ⽬的 特徴 Web上に公開している⾦融商品や投資情報について、公開前に ⼈⼿で⾏っている⽂章校正業務を⾃動化したい 公開済みの⽂章を取得するクローラーを開発し、BERT (Bidirectional Encoder

    Representations from Transformers) ベースの⽂章校正モデルを構築した イメージ 効果 ⾼精度に校正箇所を検知するモデルを構築し、⽂章校正業務の 省⼒化を実現した ECサイトにおけクーポン配信の最適化 ⽬的 特徴 クーポンを活⽤した購買促進施策を実施しているが、ユーザーによ る出し分けは実施できておらず、より効果的なクーポン配信を実現 したい 購買とクーポンの相関性をUplift Modelingを⽤いて検出し、販 促活動に反応して、実際の購買⾏動につながるセグメントを発⾒ した イメージ 効果 定価で購⼊していたターゲット層の利益が向上したことで、利益率 が15%向上した クーポンがあっ たから購⼊した クーポンがきても こなくても購⼊ しない クーポンがなく ても購⼊した クーポンがあったら 購⼊しない 説得可能 テッパン 無関⼼ 利益減の要因 にもなる ココだけに 送りたい あまのじゃく © 2022 Chura DATA Inc.
  7. データ分析事例 11 図⾯の⾃動認識による⼈⼿作業の⾃動化 ⽬的 特徴 図⾯で表現された構造を⼈⼿で解釈して情報化しており、⾮常に コストがかかっているため⾃動化したい 画像処理アルゴリズムを⽤いたテンプレートマッチングにより、図⾯で 表現された情報を⾃動的に特定し、データベース化することに成功 した

    イメージ 効果 情報化作業の⾃動化を達成した。また、パーツ同⼠の関係性や 新規パーツ出現の把握が容易となった 店内センサーログを⽤いた⾏動経路マイニング ⽬的 特徴 店内センサーログを⽤いて、顧客の⾏動パターンに応じたターゲティ ング施策を検討したい ⾏動経路パターンを可視化した上で、パターンに沿って顧客識別 を実施。また、⾏動パターンと購買⾏動の関連性を明らかにした イメージ 効果 購買⾏動に繋がるようクーポン配信を最適化することに成功した テンプレートマッチングを⾏い 利⽤パーツ情報を⾃動的に収集 他パーツとの接続の有無等を⾃動的に検出し、 構成情報を算出 平均消費額 再訪率 ・・・ ⾏動ログ (アクセスログ) ⾏動パターン セグメント KPI © 2022 Chura DATA Inc.
  8. データ分析事例 12 Web情報からの話題性の⾼いスポット情報の⾃動取得 ⽬的 特徴 Web/SNS上に公開されているスポット情報を活⽤しているが、 ⼈為的な情報収集にコストがかかっているため⾃動化したい Web/SNS上のテキストをベクトル変換し、スポット情報特有の特 徴を有しているかどうかを⾃動的に判断した。また、スポット毎に便 利な情報を⾃動的に抽出した

    イメージ 効果 ⼈⼿による情報の取捨選択作業を削減すると共に、位置情報や 施設情報のラベリング作業を効率化した ネットワーク機器の故障検知 ⽬的 特徴 ルーター等のネットワーク機器におけるCPUや通信量などの状態デ ータを利⽤して故障検知を実施したい 複数の機器から得られるデータを総合的に評価することで故障を 予知する機械学習モデルを作成し、結果を担当者にメールで通知 するシステムを構築した イメージ 効果 ⼈間が監視するだけではわからない異常についても捉えられるよう になり、運⽤の質が向上した Web/SNS上のスポット情報のテキストで話題性の⾼いものを⾃ 動的に取得し、その話題となっているお店の営業時間や位置情 報を同定するアルゴリズムを開発 故障予測した場 合はメール通知 リアルタイムで故障 予知 © 2022 Chura DATA Inc.
  9. データ分析事例 13 ⾃動⾛⾏アルゴリズム開発のためのシミュレーター構築 ⽬的 特徴 ⾃動運転⾞や⾃動⾛⾏ロボットのシミュレーションを⾏える仕組み を構築したい Unityを⽤いて⾛⾏状況を3Dで可視化し、更にPython APIと 連携した上でルートの探索やルートの指⽰が⾏える仕組みを構築

    した イメージ 効果 ⾃動運転や⾃動⾛⾏アルゴリズムの施策検証サイクルを⾼速に回 せる体制が構築できた クローラーデータを⽤いた査定価格の予測 ⽬的 特徴 専⾨査定⼠が⾏っていた商品の価格予測を、機械学習による予 測モデルで置き換えることで⼯数削減をしたい 査定データに加えて外部のオークションデータを取り⼊れることで、 商品状態と⾦額の予測精度向上を図った イメージ 効果 ⼈的コスト・査定時間の削減を実現。さらにヒトより精度の⾼い予 測が可能になった HTTP 配⾞システム © 2022 Chura DATA Inc.
  10. データ分析事例 14 商品のレビュー内容のネガポジ判定 ⽬的 特徴 ECサイトに投稿されている各商品のレビュー⽂が、ネガティブな意 ⾒なのかポジティブな意⾒なのか⾃動で判定したい ⾃然⾔語処理技術を⽤いて、レビュー⽂のネガポジを約90%の 精度で⾃動判定。更にレビュー⽂の話題を⾃動で分類することに 成功した

    イメー ジ 効果 ⼤量のレビューデータを要約することが可能となり、レビュー内容を 新規製品開発に活かせるようになった 商品名の名寄せによる検索精度の向上 ⽬的 特徴 ECサイトにて商品検索の精度をあげるために、商品の名寄せを実 施したい (e.g. 「いす」と「チェア」は同じ「椅⼦」であると判定) 商品名同⼠の編集距離に基づく名寄せロジックに加え、商品名に 含まれるキーワードとWikipedia等の既存⾔語資源を組み合わせ たアンサンブルなモデルを構築 イメー ジ 効果 商品の検索性能を10%向上させることに成功した ⾃然⾔語処理 ネガティブな意⾒ 買った3⽇後に壊 れました。もう絶 対に購⼊しませ ん。 → 「丈夫さ」に対 する評価 ポジティブな意⾒ とっても使いやすくて 満⾜です︕ また購⼊します^^ → 「使い勝⼿」に対 する評価 パイプ丸イス オフィスチェア 折りたたみ椅⼦ いす 検 索 ⾃然⾔語処理 ⼩いす 「いす」と 判定 Wikipedia 商品名 データ © 2022 Chura DATA Inc.
  11. Webサイト A → 野球の話題が多い Webサイト X → グルメの話題が多い データ分析事例 15

    Webサイトのコンテンツ分布を⾃動判定 ⽬的 特徴 数万件以上のWebサイトについて、それぞれがどういった内容のコ ンテンツを扱っているのかを調査したい 対象のWebサイトを全てクローリングし、⾃然⾔語処理技術を⽤ いて各Webサイトのコンテンツを表すワードクラウドを作成した。その 結果、コンテンツ分布が直感的に理解出来る仕組みを提供した イメージ 効果 数百万のWebページに対し、数千以上のコンテンツカテゴリを定義 し、サイト分析に役⽴てることに成功した コンテンツ⾃動タグ付けツールの開発 ⽬的 特徴 Web上から特定のコンテンツを収集して検索するサービスで、検索 機能として提供しているコンテンツへのタグ付け業務を⾃動化した い 関連情報を取得するクローラーを開発。⾃然⾔語処理技術を⽤ いてテキストの内容を解釈し、タグ付けを⾃動化 付与するタグ⾃体も⾃然⾔語処理技術で⾃動的に⽣成 イメージ 効果 新規データに対しても⾃動的なコンテンツタグ付けが可能となり、サ ービスの利便性が向上した … 野球 スポー ツ ニュー ス 怪我 移籍 イチロ ー メジャーリ ーグ 試合 連敗 公式球 芸能 料理 健康志向 ラン チ 手料理 特集 カン タン 本格的 マ マ フライ パン バレンタ イン • Wikipediaの同義 語情報をもとにタグ の表記ゆれを統⼀ • テキスト情報を元に 類似したタグをクラ スタリング ⾃然⾔語処理 旅⾏ 政治 スポーツ © 2022 Chura DATA Inc.
  12. データ分析基盤構築事例 16 社内データ分析基盤の構築 ⽬的 特徴 サイロ化したお客様社内データを1箇所に集積、社内横断的な分 析を戦術・戦略レベルで実施可能にしたい 源泉データの取込にFivetran、DWをSnowflake、可視化と分 析にBIツールであるTableau Cloudをそれぞれ採⽤、完全にサー

    バレスなデータ基盤を実現 イメージ 効果 社内データの横断分析が可能になっただけでなく、保守運⽤コスト の⼤幅減、分析速度の向上を実現 MLパイプラインの構築 ⽬的 特徴 DWに蓄積されるデータを⽤いてML処理を継続、突発的な異常 の検出や、⻑期的な傾向変化を検出したい 既存のデータパイプラインにSageMaker Pipelinesを追加で構 築、SageMaker Studioで作ったML処理をパイプライン化 イメージ 効果 データ品質低下障害の検知が可能となり、意思決定の⼿戻り 防⽌やクイックな施策実施が可能となった © 2022 Chura DATA Inc. 源泉データ Snowflake Tableau Online 利⽤者 Fivetran SageMaker SNS e-mail Model Training 元データDB DW 分析者 モデル世代管理
  13. システム開発事例 17 モデル学習⽤画像⾃動保存システムの開発 目的 特徴 画像認識で使用する画像を定期的に定点カメラから取得 し自動でファイルストレージに保存したい 複数の定点カメラから画像を取得しファイルストレージ へ自動で保存する処理をサーバ上で定期的に実行するシ ステムを構築した

    イメー ジ 効果 手動で行っていた作業を自動化することができ、モデル 学習を効率的に行うことができるようになった ⾃然⾔語処理のための社内⽂書蓄積システムの開発 目的 特徴 自然言語処理をおこなうために社内に点在する文書を1ヶ 所に集積し確認したい Elasticsearchを使用して社内に点在する文書を集積し、 文書の検索や確認ができるUIを構築した イメー ジ 効果 社内に点在する文書を一括で管理することができ、その 文書を使用して自然言語処理を実施できた カメ ラ カメ ラ カメ ラ サーバ ー ファイ ル ストレ ージ elasticsearch 文書 文書 文書 UI構築 © 2022 Chura DATA Inc.
  14. ⽂章校正サービス︓ちゅらいと 20 ちゅらいとは、最先端の⽂章校正モデルを独⾃にチューニングすることで従来のツールでは実現できなかった 様々な校正に対応しています ⽂章校正AIカスタム 既存の⽂書を活⽤して、より⾼精度な⽂ 章校正を⾏いたい場合 ⼊出⼒ファイルカスタム UIカスタム 様々な⼊出⼒ファイル形式や、貴社⽂書

    独特のフォーマット/テンプレートに対応で きるよう、追加開発を実施します 校正機能をAPI形式でご提供させて頂い たり、既存ツールへ組み込むための追加開 発を実施します 既存システムに⽂章校正機能を組み込み たい場合 普段取り扱っている⽂書ファイル形式のま ま取り扱いたい場合 貴社内で保有している既存⽂書を利⽤し てAIを再学習させることにより、貴社⽂書 独特の⾔い回し等に対応した、専⽤AIを 構築できます © 2022 Chura DATA Inc.
  15. メンバー構成 (2022年6⽉現在) 22 データサイエンティスト データアナリスト データ エンジニア データビジネス コンサルタント システム

    エンジニア Webアプリ エンジニア バック オフィス その他 アルバイト 職種別 構成⽐ UIターン率 56% Iターン Uターン 県外 フルリモート 地元 学⽣ ちゅらデータには、各ポジションに確かな実⼒を持ったメンバーが揃っています。 やりがいのある仕事を求めて多様なバックグラウンドを持つ⼈材が集っています。 © 2022 Chura DATA Inc.
  16. 求められる期待・役割を明確化し、⽬指すべきロールモデルや⾝につけるべきスキルを定めています。 グレードは給与設計に反映され、これによりスキルに準じた給与ジャンプアップが可能になっています。 グレード制度 23 期待役割 給与レンジ ジュニア • ミドル以上の指南のもと、メンバーとして顧客に価値提供ができる 450万円〜600万円

    ミドル • シニアの⼟台となる能⼒がある • ⾃⽴してプロジェクトを推進し、顧客に価値提供ができる (お客様と主体的にコミュニケーションがとれる) 600万円〜900万円 シニア • ミドルの能⼒に加え、より専⾨的な能⼒を有している 900万円〜 © 2022 Chura DATA Inc.
  17. Value 26 Be Crazy ちゅらデータでは「クレイジーさ」を⼤事にしています 例えばこんな⼈ 現状を肯定せず物事を⼈と違った視点で捉えたり 気づけば世界を変えてしまうほど何かに夢中になれるような⼈。 「好きで何かを開発してる⼈」 「いつの間にか技術ブログを書いてる⼈」

    「思いついたら⼿を動かしている⼈」 思い当たることがある⼈は、ちゅらデータにピッタリかもしれません。 Be Crazy Award クレイジーな⾔動を、Slack上で社内メンバーから「Be Crazy」の スタンプ付きで讃えられると選考対象となります。 年に⼀度、最もクレイジーな社員を「Be Crazy Award」として表 彰しています。 ※その内容はあまりにも「クレイジー」な場合があり、外部に向けて 公開できません。 クレイジーに込めた意味は、Appleの名作CM 「Think Different」 に由来しています▶ https://ja.wikipedia.org/wiki/Think_different © 2022 Chura DATA Inc.
  18. コミュニケーション 27 チャット⽂化 ちゅらデータの Slack では仕事の話のみな らず「独り⾔チャンネル」「趣味のチャンネル」 「勉強会チャンネル」など、多種多様な公 開チャンネルで活発に雑談が⾏われていま す。ここでの雑談が仕事に活きることも珍し

    くなく、ちゅらデータを形成する重要な⽂化 のひとつです。 「島」制度 アサインされるプロジェクトやギルドとは全く 別に、「島」という4つのグループがあり、メン バーはにいずれかの島に所属することになり ます。各島ごとに毎⽇朝会をやっていて、プ ロジェクトや職種の垣根を超えた雑談や相 談することで親交を深めています。 1on1 役員陣やエンジニアリングマネージャーが、 社内のメンバー全員と頻繁に1on1ミーティ ングを⾏っています。普段のミーティングやチ ャットのやり取りだけではカバーできない部 分の相談も気兼ねなくできます。「フラットさ とスピード感」は、ちゅらデータの特徴的なカ ルチャーです。 ちゅらデータでは仕事の相談から趣味に⾄るまで、「コミュニケーション」を⼤事にしています。 © 2022 Chura DATA Inc.
  19. オープンな⽂化 28 ちゅらデータでは社員全員が参加可能な会社運営を⾏っています。 下記の取り組みはその⼀例です。 アサイン公募 プロジェクトのアサインメンバーを決定する際 に、Slackチャンネル上で配属希望者を募 ります。各社員の意思を尊重しながらプロ ジェクトメンバーが決定されます。 プロジェクト会議

    毎週誰でも参加可能な会議です。 会社全体の営業状況や現在進⾏中のプ ロジェクトの状況が確認できます。 経営会議の議事録公開 CEO・CTO・VPoEが⾏う経営会議の議 事録は社員に公開され、全員が⾃由に意 ⾒や質問をできます。 © 2022 Chura DATA Inc.
  20. 勉強会 29 ※⼀部の内容は公式YouTubeチャンネルにてアーカイブを配信しています 過去に開催された勉強会テーマ(抜粋) スポットインスタンスを使ってみ よう ⼒学系⼊⾨ Julia体験会 ベイズ統計 SQL

    研修 LaTeX速習 Vue.js 計算機科学⼊⾨ 単眼深度推定 バンディットアルゴリズム Linux 座談会 ⾮機能要求グレードの使い ⽅講座 OpenCV まるわかりxRのすべて トポロジカルデータ分析 線形代数 BERT⼊⾨ 関数解析とカーネル法 venvを⽤いた環境構築 現代数学⼊⾨ React.js ⼊⾨ ファイナンス⼊⾨ MySQL Database Service + HeatWave 測度の初歩 Elasticsearch Oracleハンズオン 統計分析の基礎 Kubernetes⼊⾨ 因果推論⼊⾨ Snowflake⼊⾨ ちゅらデータでは「成⻑」を⼤事にしています。 隔週⾦曜⽇に2〜3時間の勉強会が開催されています。 © 2022 Chura DATA Inc.
  21. 対外活動 30 YouTubeチャンネルを通じた発信や⽉に1度のちゅらコラボイベント開催、 積極的なカンファレンススポンサー⽀援など、対外活動に⼒を⼊れています。 スポンサー⽀援 PyCon JPやPHPカンファレンス沖縄といったテックカンファレンスや 技育祭といった学⽣向けイベント、JTUG(Japan Tableau User

    Group) といったコミュニティー等のスポンサー⽀援や、登壇活動を積極的に⾏っています。 ちゅらコラボ(YouTube) 他社様とコラボするYouTubeライブ配信企画 「ちゅらコラボ」を⽉1のペースで開催しています。 © 2022 Chura DATA Inc.
  22. 福利厚⽣・サポート 31 資格取得⽀援 資格試験の受験料を合否 結果に関わらず会社で負 担しています。 書籍購⼊⽀援 業務に役⽴つ書籍は会社 負担で購⼊できます。 Udemy受講し放題

    ビジネスアカウントを会社で 契約しているため、動画講 義を受け放題できます。 学会参加⽀援 学会をはじめ、各種テックカ ンファレンスへの登壇や参加 を⽀援しています。 フレックスタイム コアタイムを12時-15時とし、 その前後の時間の使い⽅は 都合に応じて調整できます。 在宅勤務/⼿当て 必要に応じて在宅勤務が できます。環境を⽀援する ため⼿当てもつきます。 オフィス備品貸与 オフィスの机・椅⼦・ディスプ レイ等をリモートワークで使 えるように貸し出しています。 クラウド実験環境 AWS, GCP ,Snowflake といったクラウドプラットフォー ムで実験できる環境を⽤意 ちゅらデータは、スキルアップ⽀援 / 働き⽅の最適化に積極的に取り組んでいます。 © 2022 Chura DATA Inc.