横地 悠紀

Webサービス自社開発企業 / AI開発チーム-AIエンジニア(正社員)北海道

横地 悠紀

Webサービス自社開発企業 / AI開発チーム-AIエンジニア(正社員)

自己紹介

札幌出身札幌在住のAIエンジニア・データサイエンティストです。 AIやデータ分析の各分野との親和性の高さや、ビジネスにおける課題解決の最適解として選択されやすい点に将来性を感じながら日々業務に励んでおります。

この先やってみたいこと

未来

今後も引き続きAIを活用したサービスやプロダクトの開発にデータサイエンティストとして携わっていきたいと考えています。 起業した会社事業の企画・運用の経験と技術力を結び付けることで、より一気通貫に事業を成功へ導くマクロな視点を持った人材になることを目指しております。

Webサービス自社開発企業2ヶ月

AI開発チーム-AIエンジニア(正社員)現在

- 現在

利用ユーザー確保・運用のコストカットを目指したAI開発&データ分析業務

ITコンサル企業5ヶ月

機械学習エンジニア・データサイエンティスト(副業)現在

- 現在

データ分析/AI開発を用いたコンサル事業およびサービス開発

  • LLMを用いた契約促進&解約阻止用チャットボットの遷移図生成

    大規模言語モデル(LLM)の進展により、テキスト生成や画像生成など多様なタスクに応用することが可能になっている。一方で、企業にとって契約促進や解約阻止は重要な要素となるが、これらを強化したり効率化・自動化する直接的なLLM利用方法はまだ存在していない。この課題に対処するため、LLMの進展を活かして、ユーザーの質問や問い合わせに適切に対応するためのチャットボットやコールセンターのトークスクリプトを自動生成することに焦点を当てる。 Webサイトのリンクやサービスに関する資料をインプットとして、契約促進&解約阻止用のシナリオごとのトークスクリプトを遷移図形式で出力できるようなWebサービスを開発することをゴールとした。 まず、サービスのHPスクレイピングや提供された資料(テキスト形式)によって得られた情報に対し、解約阻止および契約促進に役立つ情報を特に残すよう要約するChatGPT-4のプロンプトとプログラムを作成した。続いて、要約した内容を基に、ユーザーの想定される質問に対して担当者(チャットボット)の模範的な回答を出力できるようにした。さらに、ユーザーがそれに共感したか否かに応じた担当者の返答を、要約した内容を基に適切なリンクと共に提供できるようにした。このように、契約促進&解約阻止用のシナリオごとのトークスクリプトを遷移図形式で段階的に完成させるプロンプト&プログラムを作成した。 これにより、解約を検討しているユーザーには、リンクをクリックすることで解約の問い合わせから離脱し、再考する機会を自然に提供する仕組みを構築した。また、契約を検討しているユーザーには、その意思決定を支援するための情報に効率的にアクセスできるシステムを完成させた。

株式会社トキワシステム1年間

取締役現在

- 現在

不動産業(海外)

アドプラットフォーム自社開発企業2年間

データサイエンティスト・アプリケーションエンジニア(正社員)

-

自社サービスのユーザーに対するデータ分析・自社サービス開発

  • 自社サービスの改善/運用業務

    弊社OW型広告プラットフォームにおいて、ABテストを通じて獲得した全てのオファーウォール案件の最適化、サービスの全体デザインの調整・コードのvue2->vue3移行を担当。また、利用メディアの新規導入作業をはじめとするサービス運用対応および障害対応を担当した。

    -
  • 年代別検証結果のデータ分析

    弊社OW利用某メディアでのABテストで、ユーザーの年代に最適化した案件掲載順(A)が売上で優勢だった。BigQuery上のデータをSQLで集計・整形し、結果をLooker Studioで可視化。Aの勝因は各年代が好む高単価案件を適切に上位表示し、売上に影響するコンバージョンを獲得したことと報告した。

    -
  • ファネル/コホート分析可視化ツールの移植開発

    使いにくいRedashのファネル分析・コホート分析可視化ツールを、使いやすいStreamlitツールに移植。集計期間やユーザー属性に基づいてデータを取得・変形し、絞り込みの二重フォームを実装してデータ取得コストを削減。図やヒートマップでデータを直感的に表現した。UIは改善し、絞り込み機能の不具合は解消。データ分析実例を用いたツール説明会を主催し、社内でのStreamlitへの移行が定着した。

    -

外資系OTTサービス運営企業1年間

機械学習エンジニア(副業)

-

分類系AIモデル構築

  • 分類AIシステムの改善施策

    2023年5月完成の映画ニュース記事分類モデルおよび同年10月完成のエンタメニュース記事分類モデルそれぞれに対し、公開日・記事テキスト&アイキャッチ画像の類似度を根拠に同一トピックと判定された記事同士に、同一ラベルを付与する仕組みを現在のシステムで導入していた。しかし、運用する中で全く関連しない記事が同一トピックとされる事例が発生したためシステム改善を行った。 また、近年の大規模言語モデル(LLM)の進歩から、ニュース記事分類タスクをより高精度かつ低コストに実行できる可能性が将来的に想定されるため、その移行に向けた調査を進めた。 ■同一トピック判定 人名、施設名、地名などの固有名詞が記事テキスト内に共通して出現している場合、記事の類似度が高くなるように調整する事で不具合は解消。 同一トピックを同一と判定できる確率(再現率)は90.7%から94.2%へ、同一と判定したものが正しかった確率(適合率)は94.7%から96.6%へ向上した。 ■大規模言語モデル(LLM)への移行可能性の調査 当時最新のLLM調査結果により、同一トピック判定処理内のアイキャッチ画像の類似度計算部分を、GPT-4 vによる分析へ差し替えた。 また、分類済の記事に2023年12月時点のPaLM2(Google)を用いたフィードバックを設置し、付与されたラベルの間違いを改善する手続きを追加した。 80%のラインであった再現率適合率が、今回の改善で再現率に大きな向上はないものの適合率はいずれも90%以上を達成した。 また、運用コストは改善前の1.14倍まで抑えることができた。

    -
  • エンタメニュース記事のメディア形態分類

    運用が困難だったエンタメニュースのタグ付けを改善するため、GPT-4と機械学習モデルを組み合わせた新システムを実装した。まず、人間によるアノテーションを行い、次にGPT-4を使って効率的なプロンプトを設計。しかし、予算上の問題でGPT-4はアノテーターとして利用し、アノテーションされた記事をLightGBMモデルの教師データとした。記事数を増やし、データの不均衡をRandomOverSamplerで対応。Sentence-BERTモデルとのアンサンブル学習を行い、全ラベル平均の再現率を0.56->0.86へ。適合率を 0.45->0.80へ向上させ、AIアプリとしての性能改善に貢献した。

    -
  • 映画ニュース記事分類精度の向上

    映画ニュースメディアの自動タグ付けを目指し、約30000の映画記事を教師データとする、LightGBMとSentence-BERTによるアンサンブルモデルを作成。しかし6つのカテゴリーでf1値が0.02未満と低く、これらカテゴリーがデータ不均衡であることが問題と特定。 対策として、未アノテーションの映画記事から2000件をランダムに抽出しアノテーション、適合率特化型LightGBMモデルとキーワード検索を用いて陽性データの抽出・追加を行った。次にアンサンブル手法を改良しSentence-BERTモデルの誤判定を補正。これによりf1値は平均0.78に向上。 さらに、公開日とアイキャッチ画像を用いて記事の類似度を計算し、同一トピックを持つ記事をグループ化。これにより同一トピックには同じラベルが付与され、精度は再現率90.7%、適合率94.7%に。 さらに、ChatGPTを用いてプロンプトフォーマットを整備し、テキストから31個の記事カテゴリーラベルを判定するタスクを行えるように。再現率・適合率いずれも約80%の精度でラベル付が可能となった。最終的には、各記事カテゴリーラベルの陰性陽性を判定するモデルを統合し、再現率84%、適合率86%の精度を実現。完成したモデルを適用させ、AIアプリとしての精度改善に貢献した。

    -
トヨタ自動車の会社情報

トヨタ自動車6ヶ月

データサイエンティスト(副業)

-

自然言語処理を用いたデータ分析

  • セールスガイドAI開発

    自動車営業の音声と文字データを分析し、営業の成功率向上を目指した。 日本語Sentence-BERTを用いて文ベクトル化し、クラスタリングで文章を分類。その後、ラベル付きテキストデータでMLPClassifierによる訓練を行い、96.0%の正解率を達成。さらにAmivoiceでの分析から10個の特徴量を抽出し、営業マンの話し方の特徴を定量化した。 この結果を用いて、営業の成功・失敗理由の自動フィードバックを支援した。

    -

東京大学大学院修士課程2年間

工学系研究科

-

深層学習を用いた盗取検知手法の提案および実装 (姿勢推定/動作推定/物体検出/時系列予測/パターン認識)

株式会社バーナイン2年間

取締役CTO(創業者)

-

受託開発およびスクール事業の企画・運用

  • サービス業/顧客データ分析・行動予測のコンサルティング

    サービスを退会する理由や退会直前の顧客の行動の分析を行い、直近で退会する可能性の高い顧客を特定。また、その顧客へのアクション内容の提案。 クライアントへのヒアリング、データ分析、分析レポート作成を担当。

  • 製造業/最適な輸送ルートのコンサルティング

    製造から物流までの全体の流れにおけるコスト改善策の提案。およびSNSにおける人間関係ネットワークや口コミ情報に基づいた商品売上の予測。 クライアントへのヒアリング、データ分析、分析レポート作成を担当。

  • 飲食業/料理注文システム開発

    飲食店における料理の販売情報の管理、デリバリー申し込み、決済を行うシステムの開発。 クライアントへのヒアリング・仕様書作成、ユーザーインターフェイス設計、プログラムコーディング、進行管理、ディレクションを担当

    -
  • サービス業/購買管理システム開発

    商品プランのショッピング機能を持ち、予約、決済を行うシステムの開発。 クライアントへのヒアリング・仕様書作成、ユーザーインターフェイス設計、プログラムコーディングを担当。

    -

個人事業3年間

フロントエンド/ バックエンドエンジニア(副業)

-

Webサイト制作 Webアプリ開発

首都大学東京(現東京都立大学)4年間

放射線学科

-

放射線測定機器 放射線物理シミュレーション 放射線生物シミュレーション 医療画像再構成技術 など



言語

  • 英語 - ビジネス会話レベル

アプリをインストールして、知り合いの最新の活躍をフォローしよう