2025-01-01から1年間の記事一覧
renderCVという履歴書を作るのに便利なパッケージがあります。 ただ、日本語の履歴書を作りこむのが面倒で、これなら専用のパッケージにしてしまおう、と思ってつくりました。 厚生労働省が出している履歴書様式例に近い履歴書をyamlからPDF出力できるCLIツ…
プライバシーポリシー 本プライバシーポリシーは、SpeedCam(以下、「本アプリ」といいます)における利用者情報の取り扱いについて定めるものです。 1. 取得する情報と利用目的 本アプリは、以下の機能を提供するために、お客様のデバイス上のデータにアク…
Vol. 1「Ollamaで動かす『フォルダ読みRAG』」では、ローカルPC上でRAGを簡単に体験することができました。 sci-gen.hatenablog.com しかし、Vol. 1 のスクリプトには「起動するたびに、すべてのドキュメントをゼロから再処理する」という大きな課題がありま…
このチュートリアルでは、Ollama で起動したローカルLLMと、AIエージェントフレームワーク Agno を組み合わせ、ローカルPC上で完結するシンプルなRAG(Retrieval-Augmented Generation)システムを構築します。 特定のフォルダ(例: ./my_docs)にPDFやPower…
4週間夜ごはん献立表 夜ごはんなにするか考えなくて済むようにメモ。 なにも考えずこれを食って生きていく。 (ちゃんと好きな食べ物は入ってます) 献立画像 夜ごはん献立 【1週目】 曜日 献立 月 鶏もも照り焼き/千切りキャベツ(惣菜)/味噌汁 火 豚こま…
apple watch が Xcodeに繋がるタイミングが本当にわからん。 今の所、パスワードを解除した状態で時計版を表示させておくと繋がることが多いです。 備忘録でした。
Xcodeでapple watchが全然反応してくれない。 なんでだ。。。 と思って数日格闘した時の備忘録です。 前提条件として、 developerプログラムに加入しているアカウントでのログインが必須です。 次に困ったことは、ログインしているにも関わらずなぜか接続さ…
表題の通り、GitHub Copilot Pro+を3ヶ月ほど使ってみました。 いつからかリクエストに制限が設けられており、まじか!絶対足りなくなるじゃん。と思っていたのですが、実態はそんなこともなかったです。 8月のプレミアムリクエスト充足率は70%程度でした。…
CLIP(Contrastive Language-Image Pre-Training)は、多様な(画像、テキスト)ペアで訓練されたニューラルネットワークです。 このネットワークは、画像から最も関連性の高いテキストスニペットを予測するように、自然言語で指示を受けることができます。 …
2025年7月29日〜8月1日に国立京都国際会館で開催された、画像の認識・理解シンポジウムMIRU2025に参加してきました! cvim.ipsj.or.jp エンジニアになって初めての学会参加です。 今回は、技術調査の目的で参加のみとなりました。 まだまだ分からないことば…
G検定合格しました~! オープンバッジ? いや、まあそれだけです。 来年には内容ほとんど変わっているんだろうなあ。。。 ランキング参加中エンジニアグループ ランキング参加中【公式】2025年開設ブログ ランキング参加中プログラミング
「ディープラーニングの応用例」に関するわからない用語について、わかりやすさを重視してGemini(2.5 Flash)に解説してもらいました。 関連用語や重要度も併記します。 ちなみにテキストは以下を使っていました。 もう受験してしまって満足して更新を怠って…
「ディープラーニングの概要」に関するわからない用語について、わかりやすさを重視してGemini(2.5 Flash)に解説してもらいました。 関連用語や重要度も併記します。 ちなみにテキストは以下を使っています。 徹底攻略ディープラーニングG検定ジェネラリスト…
「機械学習の概要」に関するわからない用語について、わかりやすさを重視してGemini(2.5 Flash)に解説してもらいました。 関連用語や重要度も併記します。 ちなみにテキストは以下を使っています。 https://www.amazon.co.jp/dp/4295018988?tag=hatena-22&li…
概要 今回は、ローカル環境に構築したアノテーションツール、CVAT (Computer Vision Annotation Tool) を使用して、初めての物体検出用アノテーションプロジェクトを作成し、最初のデータセットを完成させるまでの一連の流れを解説します。 ここでは、 * プ…
人工知能をめぐる動向に関するわからない用語について、わかりやすさを重視してGemini(2.5 Flash)に解説してもらいました。 関連用語や重要度も併記します。 ちなみにテキストは以下を使っています。 徹底攻略ディープラーニングG検定ジェネラリスト問題集 …
最近、G検定の勉強を始めました。 ディープラーニングの要素技術に関するわからない用語について、わかりやすさを重視してGemini(2.5 Flash)に解説してもらいました。 関連用語や重要度も併記します。 ちなみにテキストは以下を使っています。 徹底攻略ディ…
アプリってメニューバーからファイルを選択して読み込んだりすることが多いと思います。 今回はそのメニューバーを実装します。 groupでメニューバーを実装 コールバック関数を設定する 実際のノードを表示する処理 groupでメニューバーを実装 ノードエディ…
今回はノードエディタ内で画像を表示してみます。 今回のゴール 画像をテクスチャに変換する 1. テクスチャの読み込みと登録 (Texture Registry) 2. テクスチャの表示 (Imageウィジェットなど) 3つのノード 画像を表示する Image Display 画像情報を表示する…
今回のゴールはタブ化されていたノードエディタを、フルスクリーンに対応させることで見た目をすっきりさせます。 前回は、公式ドキュメントのコードを使ってノードエディタを作成しました。 sci-gen.hatenablog.com しかし、これだと、ノードエディタしか使…
以前、画像処理の歴史について始まりから最新までを追ってきました。 sci-gen.hatenablog.com 今回はその中でも初期のテンプレートマッチングの発展として特徴量検出手法を具体的に見ていきます。 簡単なまとめ はじめに SIFT (Scale-Invariant Feature Tran…
pythonのGUI作成ライブラリにdearpyguiというのがあります。 以前はPyside6(PyQt系)を使っていたのですが、ノードを使ったアプリが簡単に作れる、と聞いて使ってみることにしました。 今回は、公式ドキュメントのコードを使って遊んでいきたいと思います。 …
かんたんなまとめ このレポートでは、画像認識技術がどのように始まり、今までどう発展してきたかを説明します。特に、「不良品の発見」「画像の分類」「画像の領域分割」という3つの大きな課題に対して、今一番進んでいる技術を紹介します。昔の単純なやり…
前回の記事では、TensorFlowとKerasを使って、手書きの1桁数字(0~9)を認識する基本的な画像分類モデルを構築しました。 今回はそのステップアップとして、少し応用的な課題に挑戦します。MNISTのデータセットを活用し、2桁の数字(00~99)を認識するモデ…
はじめに 読み方 チュートリアル Kerasとは? MNISTデータセットによる画像分類 1. ライブラリのインポートとデータセットの準備 2. モデルの構築 3. モデルの出力形式の確認と損失関数の設定 4. モデルのコンパイル 5. モデルの訓練 6. モデルの評価 7. 確…
はじめに 使い方 スクリプトを書く プレビューを確認する 画像を保存する はじめに 図をpowerpointなどに張りたいとき画像にしたいことありますよね。 今回は、Mermaid記法で書いた図を画像として保存するアプリを紹介します。 ig4oz6iqr8.app.yourware.so …
はてなブログでMermaid記法の図にカスタムスタイルをあてる
OpenPIVのコア機能(日本語訳) Devinによって生成されたdeepwikiのCore PIV Functionalityの内容を日本語に訳しました。
%%{init:{'theme':'base'}}%% graph LR; Start[mermaid] --> Process[check]; Process --> Result[preview]; Start --> Result; はじめに スタイルを確認する default neutral forest base 注意 はじめに mermaid記法を使ったダイアグラムを書いています。 …
どうも。genです。 最近は、コーディングしなくてもいろんなことができるようになってきました。 いきなりvibe codingなんて勉強する気あるのかって? あります。。。 でも紹介させてください。 Vibe coding特化のWebサービスYourwareです。 サイトリンク ま…