要約(GPT)
The article discusses Tesla’s decision to remove ultrasonic sensors and rely solely on Vision (camera only) for its sensor suite. The author suggests that the question of whether this makes the perception problem harder or easier is not the correct question. Instead, they argue that additional sensors are not always an asset and can be a liability due to the cost and complexity of incorporating them into the system. The author points out that Elon Musk is known for simplifying systems and removing parts that are not essential, and in this case, the cost of ultrasonic sensors outweighs the benefits they provide. The article also mentions the debate around lidar as a crutch in the context of data collection systems, and suggests that whether a company has a fleet or not is more important for achieving a good functioning AI system than whether or not they have lidar.

この記事では、テスラが超音波センサーを取り除き、センサー群をVision(カメラのみ)に依存する決定を下したことについて論じています。著者は、これによって知覚の問題が難しくなるのか、それとも簡単になるのかという問いは、正しい問いではないことを示唆しています。むしろ、センサーの追加は必ずしも資産ではなく、システムに組み込むためのコストや複雑さのために負債となりうる、と主張している。著者は、イーロン・マスクがシステムを簡素化し、必要でない部品を取り除くことで知られており、この場合、超音波センサーのコストは、それがもたらす利点を上回ると指摘しています。また、記事ではデータ収集システムの文脈でライダーを松葉杖とする議論に触れ、企業がフリートを持っているかどうかは、ライダーを持っているかどうかよりも、十分に機能するAIシステムを実現するために重要であることを示唆している。

Tesla last year removed radar from um
from the sensor suite and now just
announced that it’s going to remove all
ultrasonic sensors relying solely on
Vision so camera only
does that make the perception problem
harder or easier
I would almost reframe the question in
some way so the thing is basically you
would think that additional sensors by
the way can I just interrupt good I
wonder if a language model will ever do
that if you prompt it let me reframe
your question that would be epic this is
the wrong problem sorry yeah it’s like a
little bit of a wrong question because
basically you would think that these
sensors are an asset to you yeah but if
you fully consider the entire product in
its entirety
these sensors are actually potentially
liability because these sensors aren’t
free they don’t just appear on your car
you need something you need to have an
entire supply chain you have people
procuring it there can be problems with
them they may need replacement they are
part of the manufacturing process they
can hold back the line in production uh
you need to Source them you need to
maintain them you have to have teams
that write the firmware all of all of it
and then you also have to incorporate
them fuse them into the system in some
way and so it actually like bloats the
organ the a lot of it and I think Elon
is really good at simplify simplified
best part is no part and he always tries
to throw away things that are not
essential because he understands the
entropy in organizations and an approach
and I think uh in this case
the cost is high and you’re not
potentially seeing it if you’re just a
computer vision engineer and I’m just
trying to improve my network and you
know is it more useful or less useful
how useful is it and the thing is if
once you consider the full cost of a
sensor it actually is potentially a
liability and you need to be really sure
that it’s giving you extremely useful
information in this case we looked at
using it or not using it and the Delta
was not massive and so it’s not useful
is it also blow in the data engine like
having more sensors and is a distraction
and these sensors you know they can
change over time for example you can
have one type of say radar you can have
other type of radar they change over
time I suddenly need to worry about it
now suddenly you have a column in your
sqlite telling you oh what sensor type
was it and they all have different
distributions and then uh they can they
just they contribute noise and entropy
into everything and they bloat stuff and
also organizationally has been really
fascinating to me that it can be very
distracting
um if you if all if you only want to get
to work is Vision all the resources are
on it and you’re building out a data
engine and you’re actually making
forward progress because that is the the
sensor with the most bandwidth the most
constraints on the world and you’re
investing fully into that and you can
make that extremely good if you’re uh
you’re only a finite amount of sort of
spend of focus across different facets
of the system and uh this kind of
reminds me of Rich Sutton’s a bitter
lesson it just seems like simplifying
the system yeah
in the long run now of course you don’t
know what the long run it seems to be
always the right solution yeah yes in
that case it was for RL but it seems to
apply generally across all systems that
do computation yeah so where uh what do
you think about the lidar as a crutch
debate
uh the battle between point clouds and
pixels
yeah I think this debate is always like
slightly confusing to me because it
seems like the actual debate should be
about like do you have the fleet or not
that’s like the really important thing
about whether you can achieve a really
good functioning of an AI system at this
scale so data collection systems yeah do
you have a fleet or not is significantly
more important whether you have lidar or
not it’s just another sensor
um and uh
yeah I think similar to the radar
discussion basically I um
but yeah I don’t think it it um
basically doesn’t offer
extra uh extra information it’s
extremely costly it has all kinds of
problems you have to worry about it you
have to calibrate it Etc it creates
bloat and entropy you have to be really
sure that you need this uh this um
sensor in this case I basically don’t
think you need it

テスラは昨年、レーダーをセンサー群から削除しました。
をセンサー群から外し、そして今
超音波センサーをすべて取り除くと発表しました。
超音波センサーをすべて削除し
カメラだけにすると発表しました。
知覚の問題を難しくしているのでしょうか、それとも簡単にしているのでしょうか?
難しくなるのか、それとも簡単になるのか
私は、この質問を再定義したいと思います。
基本的には
センサーを追加することです。
ところで、ちょっとお邪魔します。
言語モデルがそうするかどうか
もし、あなたがそれを促すなら、私が質問を組み替えましょう
この質問は壮大なものです。
間違った問題です。
ちょっと間違った質問です。
基本的にあなたはこれらのセンサーが
センサーは資産だと思うでしょう。
しかし、製品全体を考えた場合
全体として考えると
これらのセンサーは、実は潜在的に
負債になりかねません。
ただで付いているわけではありません。
何か必要なものがあるはずです。
サプライ・チェーン全体が必要です。
調達する必要があります。
交換が必要になることもあります。
製造工程の一部であり
生産ラインをストップさせることもある
ソースが必要であり、メンテナンスが必要であり
保守するチームも必要です。
ファームウェアを作成するチームも必要です。
そして、それをシステムに組み込む必要がある。
それを何らかの形でシステムに組み込む必要があります。
そうすると、臓器が肥大化してしまいます。
イーロンは単純化、簡略化するのがうまいと思います。
イーロンは本当に単純化するのがうまいと思います。
and I think honestly I
will make a stronger statement I think
the others some of the other uh
companies who are using it are probably
going to drop it yeah so you have to
consider the sensor in the full
in considering can you build a big Fleet
that collects a lot of data and can you
integrate that sensor with that that
data and that sensor into a data engine
that’s able to quickly find different
parts of the data that then continuously
improves whatever the model that you’re
using yeah another way to look at it is
like vision is necessary in a sense that
uh the drive the world is designed for
human visual consumption so you need
vision is necessary and then also it is
sufficient because it has all the
information that you that you need for
driving and humans obviously has a
vision to drive so it’s both necessary
and sufficient so you want to focus
resources and you have to be really sure
if you’re going to bring in other
sensors you could you could you could
add sensors to Infinity at some point
you need to draw the line and I think in
this case you have to really consider
the full cost of any One sensor that
you’re adopting and do you really need
it and I think the answer in this case
is no so what do you think about the
idea of the that the other companies
are forming high resolution maps and
constraining heavily the geographic
regions in which they operate is that
approach not in your in your view
um not going to scale over time to the
entirety of the United States I think
I’ll take two as you mentioned like they
pre-map all the environments and they
need to refresh the map and they have a
perfect centimeter level accuracy map of
everywhere they’re going to drive it’s
crazy how are you going to
we’ve been talking about autonomy
actually changing the world we’re
talking about the deployment
on a on a global scale of autonomous
systems for transportation and if you
need to maintain a centimeter accurate
map for Earth or like for many cities
and keep them updated it’s a huge uh
dependency that you’re taking on huge
dependency
it’s a massive massive dependency and
now you need to ask yourself do you
really need it
and humans don’t need it
um right so it’s it’s very useful to
have a low-level map of like okay the
connectivity of your road you know that
there’s a fork coming up when you drive
an environment you sort of have that
high level understanding it’s like a
small Google Map and Tesla uses Google
Map like similar kind of resolution
information in the system but it will
not pre-map environments to send me a
level accuracy it’s a crutch it’s a
distraction it costs entropy and it
diffuses the team it dilutes the team
and you’re not focusing on what’s
actually necessary which is the computer
vision problem
そして、正直なところ、私は
より強く主張できると思います。
他の企業は、おそらく
使っている会社は、おそらく
そうです。
センサーを考慮する必要があります。
大きな艦隊を作ることができるのか?
多くのデータを収集する大規模な艦隊を作ることができるのか、そしてその艦隊にセンサーを統合することができるのか。
センサーとデータ、センサーを統合して
データ、センサーをデータエンジンに統合して
データエンジンに統合し、データの様々な部分を素早く見つけ
データの様々な部分を素早く見つけ、それを継続的に
その結果、どんなモデルであっても継続的に改善することができます。
別の言い方をすれば
視覚はある意味で必要です
世界の駆動系は人間の視覚消費用に設計されています。
人間の視覚消費用に設計されているので、視覚が必要です。
視覚は必要であり、また、視覚は十分である。
十分である。
運転に必要な情報を持っているからです。
運転に必要なすべての情報を持っているからです。
運転するためには視覚が必要です。
必要かつ十分であるため、リソースを集中させたい。
リソースに集中させなければなりません。
他のセンサーを導入するのであれば
他のセンサーを取り入れるかどうか。
インフィニティにセンサーを追加する場合、ある時点で
線引きする必要があります。
この場合、本当に考えなければならないのは
この場合、1つのセンサーにかかる全費用を考慮する必要があります。
この場合、採用するOneセンサーのコストと、本当に必要なのかどうかを検討する必要があります。
この場合、答えは「ノー」です。
この場合の答えは「ノー」です。
他社が高解像度の地図を作成し
他社が高解像度の地図を作成し
他の企業が高解像度の地図を作成し、地理的な制約を大きくしていることについて
そのようなやり方は
このようなアプローチは、御社の見解では
アメリカ全土に拡大することはできないのでは?
アメリカ全土に拡大することはできないと思います。
私は、あなたがおっしゃったように、2つの方法をとります。
すべての環境を事前にマップしておき
地図を更新する必要があります。
センチメートル単位の完璧な地図がある。
センチメートル単位の完璧な地図を持っています。
どうやってやるんだ?
私たちは自律性について話してきました
実際に世界を変えているのです。
世界規模で
世界的な規模で展開されています。
世界規模で展開されようとしています。
センチメートル単位の正確な地図が必要な場合
地球上の地図や多くの都市の地図を
更新し続けることは、非常に大きな負担です。
膨大な依存を背負うことになります。
膨大な依存関係
膨大な依存関係です。
本当に必要なのか、自問自答する必要があります。
本当に必要なのか?
そして、人間はそれを必要としない
そうです、だから低レベルのマップがあると非常に便利なんです。
だから、低レベルの地図があるととても便利です。
道路の接続性
分かれ道があることを知ることができます。
環境では、そのような
小さなGoogleマップのようなものです。
テスラはGoogleマップを使用しています。
マップのようなものです。
テスラは、Googleマップと同じような解像度の情報をシステムで使っていますが
しかし、事前にマップを作成し、そのマップを私に送ってくれるわけではありません。
精度の高い情報を送ってくれるわけではありません。
エントロピーのコストになります。
チームを混乱させ、希薄化させる
必要なことに集中できない。
本当に必要なことに集中できない。
ビジョンの問題