《人工智能》目录

前言
AI模型框架-地址库

Attention Is All You Need 注意⼒是你所需要的

yolo相关内容
数据中心
BCC汉语语料库
理论知识
大名鼎鼎的GPT的名字解释

大语言模型（LLM）

点积，内积，数量积的定义

Transformer一篇通

解读AI大模型，从了解token开始

矩阵和矩阵相乘怎么计算

softmax函数归一化指数函数

统计语言模型（Bigram建模训练））

人工智能的黎明：从信息动力学的角度看ChatGPT
基本安装
安装torch和cuda
基本知识
【大语言模型LLM】-基础语言模型和指令微调的语言模型

【大语言模型LLM】-大语言模型如何编写Prompt?

ai的均值和标准差，方差

用初中数学理解大模型工作原理
Transformer
深入理解 Transformer 技术原理

gpt入门：picoGPT教程

gpt入门：NanoGPT教程

gpt入门：mingpt教程
脉冲神经网络 (SNN)
脉冲神经网络 (Spiking Neural Network) 解读 (一)
数据处理
chartjs：新出的图标展示框架

常用数据git
声音处理
FunASR：阿里的语音识别

Kaldi：ASR，语音识别，可以训练声学模型

星辰语音识别开源大模型：中国电信，【超多方言】ASR

最难方言温州话被攻克！中国电信语音大模型支持30种方言

播放音频文件

让 Python 来帮你朗读网页吧

从零开始搭建一个语音对话机器人

Seed-TTS：字节发布高性能高逼真语音合成框架

ChatTTS：语音合成

edge-tts：语音合成，调用的微软edge的在线语音合成服务

pyttsx3：语音转换

python实现TTS离线语音合成

StyleTTS2：one-shot语音风格迁移和逼真语音转换的论文阅读和代码实战

Matcha-TTS：语音合成，

Bailing-TTS：巨人网络支持普通话和方言混说的TTS大模型
图像处理
SAT：开源3D医学大模型SAT，性能超越72个nnU-Nets，上交大团队发布

EasyPhoto：阿里的您的智能 AI 照片生成器
视频处理
EasyAnimate：阿里高分辨率长视频生成的端到端解决方案

Tora:阿里的简单几笔快速生成精确运动控制的视频

LivePortrait：快手视频驱动照片或视频，可以复制面部表情

Champ:阿里发布的人物图片+视频转换为合成视频

Hallo:复旦大学音频+人脸图像=视频生成模型
文字处理
多模处理
VASA-1：实时音频驱动的超逼数字人说话面部视频生成技术

EchoMimic:阿里的数字人生成，语音和视频合成

MuseTalk：腾讯的AI数字人口型同步工具
动态记忆和自我反思
Reflexion：具有动态记忆和自我反思的自主代理

百度生产一个反思功能代码python
论文精选
2023年4月的12篇AI论文推荐

2023年12月论文推荐

论文解读

Seed-TTS: A Family of High-Quality Versatile Speech Generation Models
大模型LLM
本地搭建私有大模型平台

Stability AI发布AI音频模型Stable Audio Open，音乐制作

通义千问：qwen

Qwen2：阿里通义千问2.0出来了，大模型升级了

huggingface的模型文件的目录结构
AIAgent
新一代AI模型Claude 3：有大学生智商，全面超越GPT-4

FastChat——一个用于训练、部署和评估基于大型语言模型的聊天机器人的开放平台

谷歌DeepMind推出新一代药物研发AI模型AlphaFold 3

LangChain-Chatchat (原 Langchain-ChatGLM)

MaxKB本地私有大模型部署

YOLO v10视觉目标检测算法本地端部署

Fay数字人框架助理版

百度开源 / Senta - 情感分析旨

Moshi：法国的ai研究者Kyutai推出开源实时语音多模态模型

GraphRAG：微软开源的下一代 RAG 技术

Move AI 推出 Move API，实现 2D 视频转 3D 运动数据

Cloudflare 推出一键阻止 AI 机器人的新工具

腾讯开源混元 Captioner 模型，优化文生图数据集生成

改变答题顺序会显著降低大模型准确率

OpenDevin：卡内基梅隆大学教授创立 All Hands AI，推出开源 AI 软件代理 OpenDevin

漆远创立无限光年，获阿里投资进军可信大模型赛道

阿里发布 FunAudioLLM 开源项目，推出 SenseVoice 和 CosyVoice 两大语音模型

快手文生图大模型 Kolors 宣布开源

商汤科技发布 InternLM-XComposer2.5 视觉语言模型

穹彻智能推出具身大脑 Noematrix Brain，聚焦操作物理常识与行为决策

华中科技大学等团队推出 Holmes-VAD，实现视频异常检测与解释

可灵AI/Kling：快手视频生成大模型可灵 AI Kling

彻底改变语言模型：全新架构TTT，ML模型代替RNN隐藏状态

新型TTT架构诞生，能否取代Transformer和Mamba成为最强大模型？

DG4D/DreamGaussian4D：四维建模及运动控制模型

CosyVoice:阿里的语音生成，支持多语言、音色和情感控制

SenseVoice ：阿里语音识别、语种识别、情感识别、声学事件分类或检测

Seed-TTS：字节的的语音生成，太逼真太形象了

Fish-Speech：开源的TTS项目，语音生成

ollama:大模型运行平台，支持cpu运行大模型

当实时数字人遇上LLM

CMD 下的基本指令

语音对话大模型：借助阿里的FunAudioLLM搭建语音对话模型

CogVideo：智谱版Sora开源爆火，4090单卡运行，A6000可微调
功能模块

暂无章节

脉冲神经网络 (Spiking Neural Network) 解读 (一)

作者：好邻居发布时间：2024-04-30 10:51:34

阅读： 123

正文

本文目录

1 脉冲神经网络简介
2 脉冲神经网络原理
3 脉冲神经网络数据集
4 脉冲神经网络训练方法
5 脉冲神经网络评价指标

1 脉冲神经网络简介

脉冲神经网络 (SNN) 属于第三代神经网络模型，实现了更高级的生物神经模拟水平。除了神经元和突触状态之外，SNN 还将时间概念纳入了其操作之中，是一种模拟大脑神经元动力学的一类很有前途的模型。

那么什么是第一代和第二代神经网络模型呢？

第一代神经网络

第一代神经网络又称为感知器，在1950年左右被提出来，它的算法只有两层，输入层输出层，主要是线性结构。它不能解决线性不可分的问题，对稍微复杂一些的函数都无能为力，如异或操作。

第二代神经网络：BP 神经网络

为了解决第一代神经网络的缺陷，在1980年左右 Rumelhart、Williams 等人提出第二代神经网络多层感知器 (MLP)。和第一代神经网络相比，第二代在输入层之间有多个隐含层的感知机，可以引入一些非线性的结构，解决了之前无法模拟异或逻辑的缺陷。

第二代神经网络让科学家们发现神经网络的层数直接决定了它对现实的表达能力，但是随着层数的增加，优化函数愈发容易出现局部最优解的现象，由于存在梯度消失的问题，深层网络往往难以训练，效果还不如浅层网络。

所有对目前机器学习有所了解的人都听说过这样一个事实：目前的人工神经网络是第二代神经网络。它们通常是全连接的，接收连续的值，输出连续的值。尽管当代神经网络已经让我们在很多领域中实现了突破，但它们在生物学上是不精确的，其实并不能模仿生物大脑神经元的运作机制。

第三代神经网络：脉冲神经网络

第三代神经网络，脉冲神经网络 (Spiking Neural Network，SNN) ，旨在弥合神经科学和机器学习之间的差距，使用最拟合生物神经元机制的模型来进行计算，更接近生物神经元机制。脉冲神经网络与目前流行的神经网络和机器学习方法有着根本上的不同。SNN 使用脉冲——这是一种发生在时间点上的离散事件——而非常见的连续值。每个峰值由代表生物过程的微分方程表示出来，其中最重要的是神经元的膜电位。本质上，一旦神经元达到了某一电位，脉冲就会出现，随后达到电位的神经元会被重置。对此，最常见的模型是 Leaky Integrate-And-Fire (LIF) 模型。此外，SNN 通常是稀疏连接的，并会利用特殊的网络拓扑。

然而，关于 SNN 作为人工智能和神经形态计算机群体中的计算工具的实用价值，长期以来一直存在争论。尤其是和人工神经网络 (ANN) 相比。在过去的几年里，这些怀疑减缓了神经形态计算 (neuromorphic computing ) 的发展，而随着深度学习的快速进步，研究人员试图从根本上缓解这个问题，人们想要通过加强 SNN 的手段，如改善训练算法，来缓解这个问题。

与成熟有效的人工神经网络 (ANN) 训练算法：误差反向传播算法 (Back Propagation) 不同，神经网络研究中最困难的问题之一是由于复杂的动力学和脉冲的不可微性质导致的训练困难。

为了提升脉冲神经网络的精度，已有一些前人的工作做出了探索，如：

Spike timing dependent plasticity (STDP) ：无监督学习方法

1 Unsupervised learning of digit recognition using spike-timing-dependent plasticity

添加奖励机制

2 Combining stdp and reward-modulated stdp in deep convolutional spiking neural networks for digit recognition

把预训练好的 ANN 转化为 SNN

3 Spiking deep convolutional neural networks for energy-efficient object recognition
4 Spiking deep residual network
5 Fast-classifying, high-accuracy spiking deep networks through weight and threshold balancing
6 Training spiking deep networks for neuromorphic hardware
7 Conversion of continuous-valued deep networks to efficient event-driven networks for image classification

为了提升 ANN 与 SNN 的兼容性，通常把 bias 去掉，使用 ReLU 激活函数，把 max-pool 换成 average-pool 等。把 ANN 转化成 SNN 时，通常包括 weight/activation normalization，threshold tuning, sampling error compensation 等操作以维持精度。

脉冲神经网络使用 BP 算法训练

8 Hybrid macro/micro level backpropagation for training deep spiking neural networks
9 Training deep spiking neural networks using backpropagation
10 Spatio-temporal backpropagation for training high-performance spiking neural networks
11 Direct training for spiking neural networks: Faster, larger, better

在执行反向传播时，梯度可以沿着空间维度通过聚合脉冲传播，也可以沿着时间和空间2个维度通过计算膜电势的梯度传播。

简而言之，通过上述努力，SNN 在视觉识别任务中的应用精度逐渐接近 ANN。

由于 SNN 缺乏专门的benchmark，许多工作直接使用 ANN 的 benchmark 来验证 SNN 模型。例如，用于 ANN 验证的图像数据集被简单地转换为 Spike 版本，用于 SNN 训练和测试。此外，网络的准确性仍然是主要的评估指标，但众所周知，我们的大脑在绝对识别准确性方面，通常比现有的人工智能机器表现得差。这反映了我们需要更全面和公平的衡量标准来评估和模拟生物大脑工作方式的 SNN。简而言之，由于不适当的评估指标，目前的 SNN 无法击败 ANN。因此，出现了1个开放的问题，即：

如何评估 SNN 是有意义的？

Training spiking deep networks for neuromorphic hardware

这篇文章将预训练好的 ANN 转化成 SNN，在这个工作里面作者考虑到了 SNN 网络的 Efficiency，而不仅仅是 Accuracy。评价一个 SNN 时要从多个角度考量，比如：application accuracy，memory cost, compute cost 。

在以 ANN 主导的评价指标和任务中，相同大小的 SNN 无法打败 ANN。但是在以 SNN 主导的评价指标和任务中，SNN 的表现会更好。

2 脉冲神经网络原理

如下图1所示是ANN 和 SNN 的单个基本神经元。

(a) 图是典型的单个 ANN 神经元，ANN 的计算方法是：

$\begin{matrix} (1) & y = ϕ (b + \sum_{j} x_{j} w_{j}) \end{matrix}$

式中， $ϕ (\cdot)$ 是非线性的激活函数。

代表上个神经元过来的连续的激活值 (Pre-activation)，通过突触 (Synapse) 传递到树突的位置 (Dendrite)，并且最终由细胞体 (Soma) 来处理这个激活值 (具体处理方法就是1式)。

ANN 中的神经元使用高精度和连续值编码的激活值进行相互通信，并且只在空间域 (spatial domain，即 layer by layer) 传播信息。从上述方程可以看出，输入和权重的相乘和累加 (MAC) 是网络的主要操作。

(b) 图是典型的单个 SNN 神经元，它的结构与 ANN 神经元相似，但行为不同。脉冲神经元之间的交流通过 binary 的 events，而不是连续的激活值。

代表上个神经元过来的一个一个的脉冲 (Spike)，通过突触 (Synapse) 传递到树突的位置 (Dendrite)，并且最终由细胞体 (Soma) 来处理这些脉冲 (具体处理方法就是2式)。

这个式子看起来很麻烦，我们先来理解下每个变量的含义。

式中 𝑡代表时间步长， 𝜏是常数， 𝑢和 𝑠 代表膜电位和输出峰值。

𝑢（r1）和 u(r2)分别是静息电位和重置电位。

𝑤j是第 𝑗个输入突触的权重。

𝑡kj是当第j个输入突触的第 𝑘 个脉冲在 $T_{w}$ 𝑤这个积分时间窗口内激发了 (即状态为1) 的时刻。

𝐾(.)是代表延时效应的核函数。

𝑇w是积分时间窗口。

𝑢th是个阈值，代表要不要点火 (Fire) 一次。

接下来我们用人话解释一下2式是什么意思：

1 当膜电位 $u (t)$ t (也就是细胞体 Soma 这个隐含电位) 高于阈值 $u_{t h}$ th 时，脉冲神经元看做一次点火，此时输出电位 $s (t)$ 置为1，同时膜电位 $u (t)$ 回归到重置电位 $u_{r_{2}}$ 。
2 当膜电位 $u (t)$ t (也就是细胞体 Soma 这个隐含电位) 低于阈值 $u_{t h}$ th 时，不点火，此时输出电位 $s (t)$ t 保持为0。
3 在每个 time step，膜电位 $u (t)$ 的更新过程满足一个微分方程，即2.1式。
4 在每个 time step，膜电位 $u (t)$ 值应下降 $u (t) - u_{r_{1}}$ -ur1这么大的值，其中 $u_{r_{1}}$ r1 是静息电位。
5 同时在每个 time step，膜电位 $u (t)$ 值应上升一个值，这个值来的大小与这个神经元的 𝑗个输入突触有关，每个输入突触的权值是 $w_{j}$ j，这个突触对膜电位上升的贡献值是，即在个脉冲中，如果时刻的输入脉冲是点火状态 (即1状态)，那么计算一次 $K (t - t_{j}^{k})$ 并累积起来。

与 ANN 不同的是，SNN 使用脉冲的序列来传递信息，每个脉冲神经元都经历着丰富的动态行为。具体而言，除了空间域中的信息传播外，时间域中的过去历史也会对当前状态产生紧密的影响。因此，与主要通过空间传播和连续激活的神经网络相比，神经网络通常具有更多的时间通用性，但精度较低。由于只有当膜电位超过一个阈值时才会激发尖峰信号，因此整个尖峰信号通常很稀疏。此外，由于尖峰值 (Spike) 是二进制的，即0或1，如果积分时间窗口 $T_{w}$ 调整为1，输入和权重之间的乘法运算就可以消除。由于上述原因，与计算量较大的 ANN 网络相比，SNN 网络通常可以获得较低的功耗。

3 脉冲神经网络数据集

这一节介绍下脉冲神经网络的基本数据集。

像 MNIST，CIFAR10 这类基于帧的静态图像，广泛应用于 ANN 中，我们称之为 ANN-oriented dataset，如下图2的前2行所示。

CIFAR-10：32×32×3 RGB image，Training set：50000，Testing set：10000

MNIST：28×28×1 grayscale image，Training set：60000，Testing set：10000

图2的后2行 N-MNIST 和 DVS-CIFAR10 叫做 SNN-oriented dataset。这里的 DVS 叫做 dynamic vision sensor，代表使用了动态视觉传感器扫描每张 images 得到的 spike 数据。它除了具有与 ANN-oriented dataset 相似的空间信息外，还包含更多的动态时间信息，而且尖峰事件与神经网络中的信号格式自然兼容，因此我们称之为 SNN-oriented dataset。

DVS 产生两个通道的脉冲事件，命名为 On 和Off 事件 (分别如图2中红色和蓝色所示)。因此，DVS 将每个图像转换为 $r o w \times c o l u m n \times 2 \times T$ 的脉冲模式。

N-MNIST：34×34×2×T spatio-temporal spike pattern，Training set：60000，Testing set：10000

DVS-CIFAR-10：128×128×2×T spatio-temporal spike pattern，Training set：9000，Testing set：1000

一般来说，ANN 接收帧为基础的图像，而 SNN 接收事件驱动的脉冲信号。因此，有时需要将相同的数据转换为另一个域中的不同形式来处理。本文以视觉识别任务为例，主要介绍了四种信号转换方法，如下图3所示。

Image to spike pattern

由图片信号转化为脉冲信号的方法比较直观。

一种方法是：如图3 (a) 所示。在每一个时间步骤，采样的原始像素强度 (pixel intensity) 到一个二进制值 (通常归一化为[0,1])，其中的这个强度值就等于发射一个脉冲的概率。这个采样样遵循一个特定的概率分布，例如伯努利分布或泊松分布。

例如，图3(a) 中的 $i_{1}$ 1神经元，对应于标准化强度为 0.8 的 intensity，产生一个二进制尖峰序列，跟随着伯努利分布 $B (0.8, T)$ (0.8,t) 。这里 𝑇是取样的时间窗口。

再例如，图3(a) 中的 $i_{2}$ 2 神经元，对应于标准化强度为 0.1 的 intensity，产生一个二进制尖峰序列，跟随着伯努利分布 $B (0.1, T)$ (0.1,t) 。这里 𝑇是取样的时间窗口。

这种方法在取样的时间窗口 𝑇比较短时有一个较大的精度损失。

另一种方法是：如图3 (b) 所示。使用一个编码器来产生全局的脉冲信号。这个编码器的每个神经元接受图片多个像素的强度值intensity 信号作为输入，而产生脉冲作为输出。虽然编码层是 ANN-SNN 混合层，而不是像网络中的其他层那样的完整 SNN 层，但它的权重是可训练的，因为我们的训练方法也是 BP 兼容的。由于神经元的数量可以灵活定制，参数也可以调整，因此它可以适应整体最佳化问题，从而获得更高的精确度。

Spike pattern to image

由脉冲信号转化为图片信号的输出主要有2种：

binary image with 0/1 pixels。
intensity image with real-valued pixels。

如图3(c) 所示，代表把脉冲pattern转化为二值图片。2D 脉冲 pattern 可以直接看做一个二值图像 (每个脉冲 Event 代表像素强度为1，否则像素强度为0)。为了转换为强度图像 (Intensity image)，需要在一个时间窗 𝑇内随时间对脉冲时间的累积。

如图3(d)所示，代表把脉冲pattern转化为强度图片。描述了100毫秒内脉冲事件的累积过程，累积脉冲数将被归一化为具有适当强度值的像素。由于 DVS 的相对运动和固有噪声，使得图像常常模糊，边缘特征模糊。这种转换只允许一个强大的假设，每个脉冲位置不应该移动，否则将严重损害生成的图像质量。

ANN-oriented workloads

ANN-oriented workloads 的含义是目标是识别在 ANN 中经常使用的基于帧的数据集 (如 MNIST 和 CIFAR10)。有3种基准模型：

1 如下图4(a) 所示，最直接的解决办法是 ANN 训练 + ANN 推理。

2 如下图4(b) 所示，这种方案是先在 ANN 数据集上使用 BP 算法训练一个 ANN，再把这个训练好的 ANN 转化成 SNN。这个 SNN 与 ANN 拥有相同的结构，但是不同的神经元。这个 SNN 在推理时使用的是 ANN 数据集转化得到的 SNN-oriented dataset。

3 如下图4(c) 所示，这种方案是直接使用 SNN-oriented dataset 训练一个 SNN，训练方法是 BP-inspired Training。在每个时刻和位置的梯度直接由 spatio-temporal backpropagation (STBP) 方法得到。

SNN-oriented workloads

SNN-oriented workloads 的含义是目标是识别在 SNN 中经常使用的脉冲数据集 (如 N-MNIST 和 DVS-CIFAR10)。有2种基准模型：

1 如下图5(a) 所示，把脉冲数据集转化成图片，即 ANN-oriented dataset，然后使用 BP 算法训练 ANN 并推理。脉冲数据集转化成图片的方法就是图3的 (c)(d) 所示。

2 如下图5(b) 所示，这种方案是直接使用 SNN-oriented dataset 训练一个 SNN，训练方法是 BP-inspired Training。在每个时刻和位置的梯度直接由 spatio-temporal backpropagation (STBP) 方法得到。

4 脉冲神经网络训练方法

ANN 的 BP 训练方法

可以用下式表示：

$\begin{matrix} (3) & \begin{aligned} \frac{\partial L}{\partial y_{i}^{n}} = \sum_{j} \frac{\partial L}{\partial y_{j}^{n + 1}} φ_{j}^{^{'} n + 1} w_{j i}^{n + 1} \\ \nabla w_{j i}^{n} = \frac{\partial L}{\partial y_{j}^{n + 1}} φ_{j}^{^{'} n + 1} y_{i}^{n}, \nabla b_{j}^{n} = \frac{\partial L}{\partial y_{j}^{n + 1}} φ_{j}^{^{'} n + 1} \end{aligned} \end{matrix}$

SNN 的 STBP (时空反向传播) 训练方法

基于的前向模型是2式的 LIF 的 SNN 模型，为了阅读的方便再把2式写一遍。

$\begin{matrix} (2) & \begin{aligned} τ \frac{d u (t)}{d t} = - [u (t) - u_{r_{1}}] + \sum_{j} w_{j} \sum_{t_{j}^{k} \in S_{j}^{T_{w}}} K (t - t_{j}^{k}) \\ s (t) = 1, u (t) = u_{r_{2}}, if u (t) \geq u_{t h} \\ s (t) = 0, if u (t) \leq u_{t h} \end{aligned} \end{matrix}$

LIF 模型的迭代版本可以用下式表示：

$\begin{matrix} (LIF-FP) & \begin{aligned} u_{i}^{t + 1, n + 1} = e^{- \frac{d t}{τ}} u_{i}^{t, n + 1} (1 - o_{i}^{t, n + 1}) + \sum_{j} w_{i j}^{n} o_{j}^{t + 1, n} \\ o_{i}^{t + 1, n + 1} = f (u_{i}^{t + 1, n + 1} - u_{t h}) \end{aligned} \end{matrix}$

式中， 𝑜代表脉冲输出， 𝑡 代表 time step， 𝑛代表 layer index。代表膜电位的延迟效应。 $f (\cdot)$ 是阶跃函数 (step function)。这种迭代的 LIF 模型包含了原始神经元模型中的所有行为，包括集成 (integration)，触发 (fire) 和重置 (reset)。

注意，为了简单起见，我们在原来的 LIF 模型中设置了 $u_{r_{1}} = u_{r_{2}} = 0, T_{w} = 1, K (\cdot) = 1$ 。给定迭代 LIF 模型，梯度沿着时间和空间维度传播，LIF 模型的迭代版本的参数更新可以按照如下方式进行：

$\begin{matrix} (LIF-STBP) & \begin{aligned} \frac{\partial L}{\partial o_{i}^{t, n}} = \sum_{j} \frac{\partial L}{\partial o_{j}^{t, n + 1}} \frac{\partial o_{j}^{t, n + 1}}{\partial o_{i}^{t, n}} + \frac{\partial L}{\partial o_{i}^{t + 1, n}} \frac{\partial o_{i}^{t + 1, n}}{\partial o_{i}^{t, n}}, \\ \frac{\partial L}{\partial u_{i}^{t, n}} = \frac{\partial L}{\partial o_{i}^{t, n}} \frac{\partial o_{i}^{t, n}}{\partial u_{i}^{t, n}} + \frac{\partial L}{\partial o_{i}^{t + 1, n}} \frac{\partial o_{i}^{t + 1, n}}{\partial u_{i}^{t, n}}, \\ \nabla w_{j i}^{n} = \sum_{t = 1}^{T} \frac{\partial L}{\partial u_{j}^{t + 1, n}} o_{i}^{t, n} \end{aligned} \end{matrix}$
从膜电位 $u$ 到输出 $o$ 是个阶跃函数，它是不可导的。为了解决这个问题，有下面这个辅助函数计算输出 $o$ 到膜电位 $u$ 的导数值：

$\begin{matrix} (4) & \frac{\partial o}{\partial u} = \frac{1}{a} sign (| u - u_{t h} | < \frac{a}{2}) \end{matrix}$

式中，参数 $a$ 决定了梯度宽度。

$L$ 是损失函数，比如可以是 MSE Loss：

5 脉冲神经网络评价指标

众所周知，基于 SNN 的模型通常无法在绝对识别准确性方面击败当前基于 ANN 的 AI 系统，而真正的大脑在其他指标上表现更好，比如操作效率。然而，在最近的研究中，识别精度仍然是判断哪个模型 (ANN 或 SNN) 更好的主流指标，特别是在算法研究中。这是不公平的，因为 ANN 和 SNN 有非常不同的特点。例如，数据的精度 ANN 比 SNN 更高，这就使得在网络大小相同的情况下，ANN 通常比 SNN 更容易获得更好的识别精度。所有这些都表明模型评估需要更全面的度量。除了通常的精度比较，这里我们进一步介绍了内存和计算成本作为互补的评估指标。

识别精度 (Recognition accuracy)

在 ANN 中，这个精确度意味着正确识别样本的百分比。如果标签类别与模型预测的最大激活值相同，则识别结果对当前样本是正确的。

在 SNN 中，我们首先计算每一个输出神经元的 fire rate，即脉冲率，当然是在给定的时间窗 $T$ 内。然后取 fire rate 最高的那个神经元作为输出，写成公式就是：

$\begin{matrix} (5) & \hat{C} = \arg max_{i} {\frac{1}{T} \sum_{t = 1}^{T} o_{i}^{t, N}} \end{matrix}$

式中， $o_{i}^{t, N}$ 代表网络的第 𝑁层，第 𝑖个神经元在第 𝑡时刻的输出。

下面介绍的内存花销和计算花销都是指推理过程。原因有2点，一方面， spatio-temporal gradient propagation 相对于推理过程来讲非常复杂。另一方面，大多数支持 SNN 的神经形态学设备只执行推理阶段 (inference phase)。

内存花销 (Memory cost)

通常，在嵌入式设备上部署模型时，内存占用 (Memory cost) 非常重要。

在 ANN 中，存储器成本包括权重内存 (weight memory) 和激活值内存 (activation memory)。activation memory 的开销被忽略，但是如果使用查找表来实现的话应该被计算在内。

在 SNN 中，内存成本包括权重内存 (weight memory)，膜电位内存 (membrane potential memory) 和脉冲内存 (spike memory)。其他参数如点火阈值 $u_{t h}$ 和时间常数 $τ$ 等可以忽略，因为它们可以被同一层或整个神经网络的所有神经元共享。只有当脉冲触发时，脉冲内存 (spike memory) 开销才会出现。总之，内存开销可以通过下式计算：